facebook LinkedIN LinkedIN - follow
PříLOHA 7-8/2001

Zálohování a archivace dat

Josef Veškrna [ veskrna (zavináč) agora (tečka) cz ]





Informace v jakékoliv podobě se postupně stávají "měnou" příští éry. Existuje mnoho analogií mezi informacemi a penězi. Peníze i data musí být v neustálém pohybu, aby jejich hodnota neklesala, peníze i data uschováváme v bankách a chráníme je proti zneužití. V neposlední řadě se stávají informace, stejně jako peníze, terčem útoků lidí s nekalými úmysly. Ochrana peněz byla za dlouhá léta jejich praktického používání více méně zvládnuta. Přesto probíhající postupná elektronizace a digitalizace našeho reálného světa mění i tradiční formu peněz. Bez existence dokonalých a velmi složitých informačních soustav by již nebylo možné s penězi ani se zbožím efektivně pracovat a obchodovat. "Elektronické" peníze se stávají nedílnou součástí našeho běžného života, stejně jako informace v elektronické podobě. I o člověku, který s elektronikou zdánlivě nemá nic do činění, je veden souhrn informací, ať už v peněžním ústavu, tak ve státní správě nebo ve zdravotnictví. Data jsou prostě zde a je nutno s nimi zacházet s nejvyšší péčí, stejně jako s penězi.

Na rozdíl od financí je často nutné a velmi důležité, informace uschovávat po dlouhou dobu v nezměněné podobě, vznikají elektronické archívy dat. Proto rozeznáváme při jejich úschově dva základní způsoby nakládání s daty - zálohování a archivaci.

Vysvětlení pojmů "záloha" a "archív"
Záloha tvoří "pojistku" před havárií. Zálohujeme proto, abychom byli schopni rychle obnovit plně funkční stav systému těsně před katastrofou. Naproti tomu za archív lze považovat data uložená na bezpečném místě, která jsou určena k pozdějšímu použití. Jeho životnost se počítá na desítky let, zatímco zálohu využijeme buď ze dne na den, maximálně s odstupem několika měsíců. Z toho tedy vyplývají rozdílné požadavky na média pro archivaci nebo pro zálohování. Archivační technologie nebývá příliš citlivá na rychlost přesouvání informací. Důležitější je data rychle vyhledat a pak je efektivně použít. Při obnovování počítače po havárii půjde jednoznačně o čas, kdy každá ztracená minuta může mít nedozírnou cenu.

Zálohování
Pod tímto pojmem rozumíme "Vytváření bezpečnostní kopie dat nebo celého operačního systému tak, abychom mohli v případě havárie některé součásti počítače, obnovit stav, který existoval těsně před vznikem poruchy".

Archivace

Představuje především shromažďování informací pro případné pozdější použití. Počítáme při tom i s nasazením technologií pro rychlé vyhledávání a třídění výsledků. Pro práci s archivem pak bude nejdůležitější jeho uspořádání, dlouhodobá spolehlivost a vysoká trvanlivost.

Technické prostředky pro úschovu dat
Není možné zcela jednoznačně určit, který typ zařízení je předurčen k tomu kterému druhu použití. Následující fakta berme jako určitá doporučení.

Periferie vhodné pro archivaci: Jednotky magneto-optických disků, jednotky optických disků CD nebo DVD, jednotky pro média s jedním možným zápisem (WORM - Write Once Read Many). Mezi jednotlivými technologiemi existuje samozřejmě řada rozdílů, ale společným jmenovatelem pro jejich fungování je rychlý náhodný přístup k požadovaným informacím, snadná manipulovatelnost a skladovatelnost. Nejvíce nás bude pravděpodobně zajímat trvanlivost záznamu, která může dosahovat i 100 let. Vyvstává však logická otázka, jak se vyrovnat s nikdy nekončícím vývojem techniky a technologií v tak velkém časovém horizontu. Proto by při volbě archivačního zařízení měla důležitou roli hrát i předpokládaná zpětná kompatibilita, popřípadě možnost budoucí automatické konverze na jiný, modernější formát. Základním předpokladem fungování archívu je jeho automatizace. Velké množství souborů a velké objemy dat již nelze z praktických důvodů zvládat ruční manipulací.

V dnešní době se stále v archivních systémech nejvíce uplatňují optické systémy ukládání. Je pravdou, že jejich kapacita dnes již není příliš adekvátní, ale nenahraditelná je jejich životnost a odolnost proti vnějším vlivům. Na špici technologií kraluje magneto-optický záznam s dnes dostupnou kapacitou 9.1 GB na jednu kazetu a 12" WORM s kapacitou 30 GB na jedno médium a garantovanou životností pro čtení 100 let. Velmi populární optické technologie CD a DVD by mohly dosahovat také trvanlivosti v řádech desítek let, ale pouze v lisované podobě. Média zapisovatelná a zejména přepisovatelná zdaleka nepředstavují vhodný prostředek na dlouhodobou úschovu informací. Důvodem je především velká snaha výrobců dosahovat velkých výrobních objemů a snižování ceny v konkurenčním prostředí, ovšem to vše na úkor trvanlivosti a odolnosti záznamu. Médium skutečně vhodné pro dlouhodobou archivaci je vždy chráněno pevným obalem a samotný nosič má velmi robustní konstrukci. Uživatel za běžných okolností aktivní povrch média nikdy neuvidí.

Nejznámější výrobci optických zařízení jsou HP, Plasmon, SONY a Maxoptix. Pod vlastním značením je samozřejmě najdete i u velkých výrobců počítačů.

Periferie a média vhodná pro archivaci jsou charakterizována vysokou rychlostí vyhledání informace a dlouhou trvanlivostí, řádově mnoho desítek let. Značná je jejich odolnost proti vnějším vlivům prostředí.

Periferie více vhodné pro zálohování: Páskové mechaniky - jejichž společnou vlastností je sekvenční přístup k informacím, jsou nejčastějším prostředkem pro krátkodobou a střednědobou úschovu dat. Sekvenční, neboli postupný záznam, je zdánlivě nevýhodný pro svou pomalost, ale opak je pravdou při dlouhém a plynulém přísunu dat. Páskové jednotky a ovládací programy jsou navzájem optimalizovány tak, že datový tok je velmi rychlý. Nejjednodušší mechaniky zapisují data rychlostí kolem 0,5 GB/hod, zatímco nejvýkonnější zařízení dokáží uschovat přes 40 GB/hod. Výkonnost zálohovací periferie bývá vedle její kapacity důležitým kritériem při výběru. Jestliže je to nutné, je dokonce možné páskové jednotky sdružovat do tzv. páskových polí, jejichž kapacita se rovná součtu kapacit jednotlivých médií a rychlost paralelního zápisu se blíží teoretickým přenosovým rychlostem periferní sběrnice. Páskové pole bývá také organizováno do architektury RAIT (Redundand Array Of Tapes), která podobně jako diskové pole RAID dokáže odolat poruše libovolné mechaniky nebo přetržení média. Zápis dat na magnetickou pásku má dlouhou historii a přes všechna svoje úskalí se prosazuje především nejvýhodnějším poměrem ceny ke kapacitě. V poslední době se stále více prosazuje typ záznamu v lineárních stopách, oproti záznamu šikmému. Šikmý záznam známe dobře z domácího videa. Hlava se rychle otáčí a je opásána pomalu se posouvajícím magnetickým pásem. Tyto dva pohyby znamenají enormní zátěž pro hlavu samotnou, ale i pro nosič magnetického materiálu. Obojí se velmi rychle opotřebovává. Pro dosažení slušné spolehlivosti je nutno používat velmi kvalitních a odolných materiálů pro výrobu obou součástí, hlav i média. Naproti tomu lineární techniky zápisu znamenají podstatné zjednodušení mechanického uspořádání záznamového a čtecího mechanizmu. Magnetický pás se pohybuje kolmo na oblou hranu magnetické hlavy a dochází tak k minimálnímu namáhání obojího.

Vzhledem ke značné zranitelnosti magnetického záznamu jsou všechna pásková zařízení vybavena mnoha systémy pro zabezpečení proti vadám média. Vady média vznikají u všech záznamových materiálů jak při výrobě, tak i během jejich používání vlivem tepla, mechanického namáhaní, zaprášení, ale i přirozenou ztrátou kapacity samotného magnetického materiálu. Používají se různé principy samo-opravných kódů, které se využívají jak při zápisu, tak při čtení. Všechny moderní páskové jednotky navíc pracují systémem "čtení po zápise". To znamená, že informace, které jsou zapisovány, jsou okamžitě opět čteny a porovnávány s originálem. Při výskytu nesrovnalosti se zápis přeruší a vadné místo vynechá.

Nejznámější výrobci páskových technologií jsou IBM, HP, Seagate, Quantum, Tandberg Data, SONY, Exabyte.

Periferie a média vhodná pro zálohování se vyznačují velmi rychlým ukládáním a čtením celého obsahu, nízká cena za uložený MB předznamenává i jejich relativné krátkou životnost, výjimečně do 30 let. Jejich odolnost proti vlivům prostředí je omezená.

Plánování zálohování
Každá činnost, aby měla nějaký smysl, musí mít svůj vnitřní řád. Nejhorší je samozřejmě nedělat zálohy vůbec žádné. Stejného výsledku můžeme ale dosáhnout zálohováním, které se děje nepravidelně a nekontrolovaně. Nakonec uschovaná data bývají natolik neaktuální, že jsou prakticky nepoužitelná. U větších informačních systémů se neorganizovanost vymstí i v případě pravidelného zálohování, ale neexistencí plánu obnovy. Plán obnovy je vlastně jakýmsi krizovým plánem, ve kterém bychom měli pamatovat na souslednost jednotlivých úkonů, které je potřeba postupně vykonat, abychom provedli rekonstrukci dat s úspěchem. Plán obnovy musí být pravidelně aktualizován, aby odrážel pokud možno stále skutečný stav organizace. V krizovém plánu je obnova dat sice podstatnou, ale nikoliv jedinou nutnou činností. Je například dobré znát umístění médií s poslední zálohou, znát případná hesla, kterým bývá záloha ochráněna. Nezřídka se stává, že některá data nebyla z rozličných důvodů na média zapsána, například otevřené či poškozené soubory. Je pak nutné mít dokonalou dokumentaci o provedených zálohách a vědět, co obnovit lze a co nikoliv.

Měli bychom si uvědomit, že obnova dat po havárii je velmi stresující chvíle pro všechny zainteresované a všechny chyby, které v těchto minutách a hodinách uděláme, jenom oddálí vytouženou chvíli spuštění opět fungujícího systému. Proto se snažíme maximum úkonů svěřit automatům, jejichž činnost musíme ale pravidelně kontrolovat.

Automatizace úschovy dat
. Odstraňuje nespolehlivý lidský faktor, zabezpečuje správné výměny médií.
. Pravidelně provádí naplánované akce.
. Dopodrobna dokumentuje všechny činnosti.
. Hlídá technický stav médií a mechanik, stará se o čištění mechanik.
. Pravidelně informuje správce systému o výsledku práce.

Nezbytnou součástí dobrých řídících programů je i podpora páskových a optických knihoven. Robotická knihovna obsahuje sady médií, které jsou uloženy v zásobnících a odkud je robot sám vyjímá a vkládá do jedné nebo i více záznamových mechanik. Pro snížení pravděpodobnosti zničení zdroje i úložiště dat bude nezbytné přijmout organizační opatření, které umístí knihovnu mimo běžné kancelářské prostředí, nejlépe do místnosti serverů a u velkých organizací s vysoce cennými daty stojí za úvahu umístit centrální výpočetní prostředky úplně mimo hlavní budovu. Pro další zvýšení bezpečnosti je možné pracovat s několika identickými sadami médií, jejichž kopie jsou po určitou dobu umístěny na bezpečném místě. Jako nejbezpečnější se jeví vytváření přesného zrcadla informací na stejných knihovnách umístěných ve vzdálených lokalitách, řádově několik kilometrů. To umožňují dnešní moderní technologie SAN (Storage Area Networks) a rychlé periferní komunikace FC (Fibre Channel).

AGORA plus

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Modernizace IS je příležitost přehodnotit způsob práce

IT Systems 4/2025V aktuálním vydání IT Systems bych chtěl upozornit především na přílohu věnovanou kybernetické bezpečnosti. Jde o problematiku, které se věnujeme prakticky v každém vydání. Neustále se totiž vyvíjí a rozšiřuje. Tematická příloha Cyber Security je příležitostí podívat se podrobněji, jakým kybernetickým hrozbám dnes musíme čelit a jak se před nimi můžeme chránit. Kromě kybernetické bezpečnosti jsme se zaměřili také na digitalizaci průmyslu.