facebook LinkedIN LinkedIN - follow
IT SYSTEMS 11/2014 , AI a Business Intelligence

Kolik nás stojí osiřelá, opuštěná, zbloudilá a zapomenutá data?



Hitachi Data SystemsKaždý, kdo někdy pracoval v podnikovém IT třeba i malého podniku, ví, co se stane, když končí projekt nebo odchází zaměstnanec. Ať už se končí v dobrém nebo ne tak v dobrém, proběhne rozlučková party, fotky z ní se nahrají někam na sdílenou storage, rozešle se goodbye-email. Když odchází pracovník, zpravidla vrátí ajťákům laptop s „preventivně“ přeformátovaným nebo zakryptovaným diskem, ti mu zablokují přihlášení, někdy i smažou emailovou schránku, HR mu dá jeho „papíry, recepční si vezme vstupní kartičku a adieu! Soubory a emaily ex-zaměstnance nebo smluvního pracovníka ale zůstávají opuštěné ve firemní síti.


Navštívíte-li 2. ledna manažera projektu, který skončil k poslednímu dni předešlého roku, a zeptáte-li se ho co dělat s mnoha desítkami GB co po jeho projektu zůstaly, odpoví vám jedinou větou: „Ale já už ten projekt nedělám.“ Můžete zkusit pokračovat dál, „Tak já to smažu.“ „Jen na tvoji zodpovědnost.“

 

Kolik dat za nimi zůstává

Představme si firmu o 100 lidech. Roční průměrná fluktuace zaměstnanců je mezi 15-20% podle oboru. Kdyby každý propuštěný zaměstnanec nebo ukončený projekt po sobě zanechal jenom 40GB dat, je to dejme tomu terabajt ročně. Ne terabajt ležící na disku z PC shopu, ale terabajt na serverech, na NASu, v kolaboračním nástroji, zpravidla na výkonném diskovém poli. Terabajt zmultiplikovaný zbytečnými zálohami na páskách, snapshoty, překopírováním „pro jistotu“. Terabajt o který je potřeba se starat, terabajt který je potřeba migrovat, další terabajt k administraci. Po několika letech může být třeba polovina dat, která musíte přesouvat na nové zařízení protože staré dožilo, zbytečná, a tím je zmařena i polovina úsilí, které na přesun vynaložíte.

A kolik to stojí? Mají ta data cenu?

Data za lidmi i za procesy zůstávají za stavu, kdy celkové náklady na průměrný TB jsou podle Gartnera přes 3000 dolarů ročně, a roční nárůst datové kapacity, způsobený i těmito daty, je 40-60% ročně.

Většina z onoho terabajtu dat nebude mít velkou hodnotu. Budou to dávno nepotřebné pracovní verze dokumentů, tabulky s neaktuálními financemi, odprezentované prezentace a emailové archivy. Ale zlomek z těchto dat může obsahovat něco velmi cenného. Osobní data, obchodní tajemství, intelektuální vlastnictví, účetní doklady. Ztráta těchto dat by proto mohla znamenat velké právní a tedy finanční riziko, a proto je dnes běžnou strategií „uchovat raději všechno“. Při takovém postupu jsme ale zase vystaveni riziku stíhání za to, že uchováváme citlivé informace, které jsme byli povinni skartovat. Představte si zaměstnance, který si z nedostatku jiných možností zazálohoval všechna data z osobního smartphone do svojí sdílené složky na síti. V případě pracovněprávních sporů vám zanechal kukaččí vejce.

Jak celý problém řešit

Řešení problematiky nestrukturovaných dat zpravidla začíná zjištěním, že dat, která nikomu nepatří, ale nikdo si nevezme „na triko“ rozhodnutí je smazat, je už zoufale velká hromada, a že zabírají storage, kterou byste využili daleko lépe. Nakupovat další kapacitu není řešení, i kdybyste měli peníze, nechcete aby přidaná kapacita dál zpomalovala vaše NASy, sharepointy nebo fileservery. Většina souborových úložišť totiž s přibývajícími daty zpomaluje – narůstá počet položek v adresářích a tudíž počet inodů nebo jiných strukturálních metadat, která je nutno zpracovat při každém přihlášení, každém antivirovém scanu, každé záloze. Nejlepší by tedy bylo nějaká data přesunout, třeba i do cloudu. Ale jak na to – když vlastně nevíte, jaká data máte a zda je můžete pustit ven? A jak je přesunete a neztratíte nad nimi kontrolu?

Podle celkového množství nestrukturovaných dat, která jste za ta léta shromáždili, můžete zvolit kombinaci přístupů. Doporučujeme začít tieringem – pořiďte si storage, která umí transparentně tierovat neaktivní data, na blokové, ale lépe na souborové úrovni. Pomocí jednoduchých politik dokážete přesunout neaktivní data mimo ty nejvýkonnější disky, na levnější zařízení, nebo na pásku s filesystémem, na archivní storage s kompresí nebo (zakryptovaná) i do cloudu. Přistupovat k nim můžete jako předtím, najdete je díky stubbingu na původním místě.

Dalším krokem, který vám pomůže, je pořídit si objektovou storage. Pojem zní tajemně, ale tím, že vaše soubory zpracuje jako objekty, tzn. oddělí metadata (konkrétně strukturální a systémová) od samotných dat souborů, umožňuje objektová storage procházet filesystémové struktury a vyhledávat soubory a data i bez znalosti jejich umístění. Její výkonnost tedy neklesá ani při vysoké kapacitě a vysokém počtu zpracovaných souborů.

Završit svůj úspěšný souboj s datovými sirotky můžete završit pořízením software, který při archivaci souborů prochází data a extrahuje z jejich obsahu tagy, které pak může objektové úložiště také indexovat. Tak získáte skutečný datový archiv, kde snadno vyhledáte přesně to, co vás zajímá, a to i při různých legálních procesech a auditech, i když aplikace a IS, které data uložily, už dávno neexistují. Budete moci odpovědět na poptávku po „tom excelu, kde jsme spočítali v roce 2004 desetiletý business plán a teď ho chceme vyhodnotit a nevíme, kam jsme ho dali.“ Všechna data ve vaší firmě budou tímto systémem adoptovaná, a proto budou přispívat k dalšímu pokroku celé společnosti.

Vladimír Blažek, Hitachi Data Systems Vladimír Blažek, Hitachi Data Systems
Autor článku je Senior Solutions Consultant společnosti Hitachi Data Systems.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Konec papírování, digitalizujte a usnadněte si práci!

IT Systems 3/2024V aktuálním vydání IT Systems jsme se zaměřili na vývoj digitalizace ve světě peněz, tedy v oblasti finančnictví a pojišťovnictví. Dozvíte se například, proč je aktuální směrnice PSD2 v inovaci online bankovnictví krokem vedle a jak by její nedostatky měla napravit připravovaná PSD3. Hodně prostoru věnujeme také digitalizaci státní správy a veřejného sektoru, která nabírá obrátky.