facebook LinkedIN LinkedIN - follow
Tematické sekce
 
Branžové sekce
Přihlášení SystemNEWSPřehledy
 
Tematické seriály

Jak uřídit IT projekt a nezbláznit se

Užitečné tipy a nástroje pro řešení problémů řízení inovací a vývoje produktů...

články >>

 

Industry 4.0

Průmysl 4.0

Jaký vliv bude mít čtvrtá průmyslová revoluce na výrobu a výrobní firmy?

články >>

 
Nové!

RPA - automatizace procesů

Softwaroví roboti automatizují obchodní procesy.

články >>

 
Nové!

IoT – internet věcí

Internet věcí a jeho uplatnění napříč obory.

články >>

 
Nové!

VR – virtuální realita

Praktické využití virtuální reality ve službách i podnikových aplikacích.

články >>

 
Nové!

Bankovní identita (BankID)

K službám eGovernmentu přímo z internetového bankovnictví.

články >>

 

Příručka úspěšného IT manažera

Dnes je řada IT manažerů opomíjena. Úspěšní bývají brouci Pytlíci a Ferdové...

články >>

 
 
Partneři webu
IT SYSTEMS 10/2006 , ITIL – Řízení IT

Kam kráčí data management

Josef Herynek, Štepán Krása, Martin Másílko


I když možná nestíháte sledovat všechny novinky ve světě informačních technologií, určitě vám neunikl fakt, že objemy spravovaných dat a odpovídající kapacity pevných disků poskočily v uplynulých letech o několik řeckých předpon slova bajt kupředu. Proto v nynější terabajtové době hledá mnoho firem nová řešení pro ukládání, zálohu a archivaci dat, která jim umožní se s rostoucími objemy informací vypořádat.


Ukládání a zálohování

Základní technologií využívanou k ukládání dat jsou tradiční fileservery (DAS – direct attached storage), které však již dnes neodpovídají požadavkům na ně kladeným, neboť stále více společností vyžaduje kapacity v jednotkách terabajtů (TB) nebo i větší s další snadnou rozšiřitelností. Výhodou DAS je jednoduchost implementace a nízká cena, pokud dat není mnoho nebo nemusí být distribuována mezi více aplikací nebo serverů. V posledních několika letech je možné sledovat zmenšování tržního podílu řešení DAS ve prospěch technologií NAS a SAN (network-attached storage a storage area network), za které nakupující utrácejí asi 70 % prostředků vynakládaných na storage technologie (celkově asi 30 mld. USD, z toho nejvíce tvoří hardware, ale nejdynamičtěji rostou služby). Kupující na nich oceňují především možnosti rozšíření a snadnou správu a nekomplikovanost z pohledu koncových uživatelů.
Technologie NAS je charakterizována užitím tzv. NAS enginu, který přebírá většinu povinností dříve spočívajících na straně uživatele přistupujícího k datům (celým souborům) a vytváří virtualizační vrstvu mezi uživatelovým strojem (hostem) a diskovými poli. Protože je implementován přímo v síti, celé řešení pak funguje jako sdílený diskový server, na který mohou přistupovat různí klienti, nebo sdílené úložné zařízení, ke kterému může být současně připojeno víc různých hostů s vícero servery nebo klienty. Výhodou virtualizace je, že vlastní disková zařízení mohou být měněna, popřípadě konfigurována, aniž by to mělo nějaký dopad na síťové operace nebo jednotlivé servery. Dodaná řešení jsou snadno instalovatelná a obvykle se spravují vzdáleně pomocí webového rozhraní. Protože se NAS řešení chovají jako nezávislé úložné servery, mohou využívat možností autorizace a autentifikace přístupu k jednotlivým serverům, bez potřeby modifikace uživatelských účtů a jejich oprávnění, případně operovat s více přenosovými protokoly. Jejich nevýhodou je omezená rozšiřitelnost – za NAS enginem se skrývá klasické DAS řešení.
V případě použití řešení na bázi SAN architektury je vlastní uložení dat (blokově orientované – fyzicky na běžných discích, v polích RAID, páskových knihovnách a dalších zařízeních) centralizováno v separátní síti, přičemž přístup do ní může řídit více serverů s nainstalovaným speciálním softwarem. Transport dat uvnitř úložné sítě probíhá efektivně tak, aby nezatěžovalserver a neovlivňoval výkon sítě – nezvětšuje síťový provoz vnější LAN. V úložné síti jsou implementovány I/O procesy, které zajišťují spojení aplikačních serverů se záznamovými zařízeními a záznamových zařízení mezi sebou. Data mohou být sdílena více aplikačními servery. V současné době je ve většině řešení použito dedikované Fiber Channel (FC) sítě, stále větší popularitu si pro méně náročná řešení získává iSCSI (internet small computer system interface), které je oproti Fiber Channel navrženo tak, aby mohla být využita stávající TCP/IP síťová infrastruktura. Instalace je pak levnější a obsluha snadnější. SAN odstraňuje jednu z hlavních nevýhod přímého připojení úložného zařízení k serverům limitovanou rozšiřitelnost. Navíc umožňuje připojení páskových knihoven, na které mohou být zálohována data ze všech ostatních datových úložišť, a to dokonce bez zásahu řídících serverů. Implementace SAN ovšem přináší vysoké náklady (fiber network vyžadují speciální síťové prvky) a je poměrně složitá.

Stále více funkcí dostupných dříve pouze u „top“ produktů se nyní dostává i do nižších segmentů, ve kterých zákazníci také požadují obdobnou spolehlivost a dostupnost jako v nejvyšší třídě. Přesto jsou však výše zmíněná řešení poměrně nákladná. Menší firmy, které si nemohou dovolit financovat zařízení nebo kvalifikovanou sílu, která ho bude obsluhovat, mohou sáhnout i po službách outsourcingových firem – například po on-line zálohování (storageon- demand). Navzdory poklesu cen o 80 % v posledních pěti letech je však trh s ním ještě nevyzrálý, uživatelé se stále bojí svěřit svá citlivá data „komusi neznámému“. Zálohování může probíhat kontinuálně, vyžaduje však dostatečně rychlé síťové připojení. Výhodou je, že zálohy jsou mimoděk uloženy na jiném místě, což docenila řada amerických společností až po 11. září 2001, v našich končinách při povodích a požárech.

Archivace

V oblasti archivace a možností jejího provádění se začínají prosazovat nové trendy, jsou dostupné produkty na bázi hierarchical storage managementu (HSM) nebo aktivního archivování (redirection). Obě využívají toho, že rozdělí data na aktivní (menší) a neaktivní část. Pro všechny nové technologie je však důležité, aby uživatelé (případně aplikace) měli svá data stále po ruce a přechod na nový způsob archivace vůbec nezaznamenali, aby přístup k nim byl transparentní. Společnost Gartner odhaduje, že trh s archivačními nástroji v následujících letech poroste průměrně o třetinu za rok. Ještě dynamičtější rozvoj patrně zaznamená segment zaměřený na archivaci e-mailů.
Cílem tradičního způsobu archivace je záloha aktuálního stavu souboru a uchování těchto dat, protože to společnost tak chce (pro případ pozdějšího znovupoužití), protože musí (nařizuje jí to zákon či jiná norma), nebo protože sama archivace je základním faktorem pro vytváření výnosů organizace. Zdrojová data přitom mohou, ale také nemusejí být vymazána. Existuje řada dalších možností, jak archivaci zlepšit – například její automatizace, vymazání souborů po vypršení jejich expirační lhůty, „shlukování“ dat patřících k jednomu projektu do jediného zálohovacího souboru apod.
HSM, jak už název napovídá, představuje sofistikovanější řešení využívající optimálně tři úrovní uložení dat – neaktivní data jsou z primárního úložiště představovaného například NAS s rychlými SCSI nebo FC disky přesunuta do úložiště tvořeného levnějšími a pomalejšími velkokapacitní disky a následně do úložiště nejnižšího stupně, ve kterém může být použita třeba pásková knihovna. HSM monitoruje využívání souborů jednotlivými programy a nepracuje-li se souborem tak často, případně překročí-li objem dat vyhrazených aplikaci stanovenou mez, jsou data automaticky migrována na prostřední stupeň úložiště a na jejich původním místě je zanechán soubor zabírající zlomek velikosti s ukazatelem na novou lokaci. Pokud chce někdo k původním datům přistoupit, narazí na soubor s ukazatelem a systém (reprezentovaný HSM klientem) automaticky „natáhne“ data zpět na jejich předchozí umístění na primárním disku. Uživatel (nebo aplikace) nic nepozná, kromě zvýšené přístupové doby. Tuto funkci však musí podporovat operační systém i jiné programy, neboť jinak se může stát, že například při indexování nebo antivirové kontrole budou data přesunuta zpět z nižších stupňů úložišť, stejně tak pokud uživatel klikne na „odkazovací soubor“, budou data putovat z úložiště zpět.
Aktivní archivování našlo své první použití při archivování e-mailů. Místo souborů „ukazatelem“ používají virtuální adresáře, zástupce nebo symbolické linky odkazující na místo, kde jsou data uložena. Na rozdíl od HSM však může na jeden soubor v archivu odkazovat více těchto zástupců a při smazání jednoho z nich nemusí dojít ke znepřístupnění archivovaných dat. Tento způsob také efektivně omezuje redundanci. Současně platí, že když uživatel k datům přistupuje, neznamená to, že jsou automaticky natažena zpět na primární disk. Aktivní archivování též nevyžaduje žádnou speciální podporu od operačního systému. Nevýhodou je nutnost věnovat zvýšenou pozornost „prolinkování“ mezi soubory – jestliže je v rámci jednoho souboru vytvořen odkaz na jiný soubor a ten je následně přesunut do archivu, pak odkaz nemusí být funkční.
Největší nárůst nyní zaznamenává archivování e-mailů – jak zákonné normy, tak politika společnosti vedou k uchovávání tohoto druhu dat. Na trhu se vyskytují řešení od těch nejjednodušších, které s e-maily zacházejí jako s běžnými soubory, až po ty dedikované, které obsahují indexovací a kompresní nástroje na bázi aktivní archivace. Jimi vytvořený archiv přístupný jak z poštovního klienta, tak přes webový prohlížeč je automaticky zálohován například právě s využitím HSM.
Při archivování dat z databází je klíčovou vlastností produktů schopnost zachovat konzistenci specificky uložených dat v tabulkách. Ty se mohou ukládat jako (ne)úplná kopie původní databáze ve stejné formě, nebo data ztratí svůj charakter uložením v XML souboru, který přesně popisuje vztahy mezi tabulkami, indexy a dalšími prvky tak, aby mohla být celá databáze zpětně rekonstruována. Výhodou tohoto řešení je snadné prohledávání (probíhá mimo databázi) a nekomplikovanost (nejsou třeba dvě databáze).

Z krátkého výčtu způsobů archivace vyplývá, že v současnosti existuje pro každý druh obsahu samostatný archivační nástroj (např. pro ERP aplikace, SAP dokumenty, klasický file archiving apod.). Tento stav se však pravděpodobně změní. V budoucnosti dílčí programy zkonvergují do jediné aplikace s jedním uživatelským rozhraním, a ta nahradí všechny stávající nástroje a nebude pro ni důležité, jaká data a na jaké médium ukládá. To umožní, aby se data, která jsou generována a ukládána, někdy i redundantně, po různých odděleních firem, spojila v jednotném úložišti.

Autoři článku působí ve společnosti Accenture v sekci Global Technology Consulting.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.