facebook LinkedIN LinkedIN - follow
Cloud computing a virtualizace IT , Cloud a virtualizace IT , IT Security

Jak funguje zálohování virtuálních serverů

Pavel Žák


zálohování virtuálních serverůVirtualizace změnila způsob práce se servery jednou provždy. Ale víte, jak funguje zálohování? Samozřejmě je možné virtuální stroje zálohovat stejně jako fyzické servery, tedy nainstalovat specializované aplikace do všech operačních systému na všech virtuálních strojích. Není potřeba se učit nic nového, doteď to nikoho neobtěžovalo, a navíc je to zadarmo. Není však škoda nevyužít potenciál, který virtualizace nabízí v tomto ohledu?


V dnešním článku detailně rozebereme zálohování virtuálních strojů tak, jak bylo počátkem třetího tisíciletí namyšleno. Budu se opírat o více než dekádu zkušeností, na jejímž konci jsem založil firmu pro vývoj vlastního zálohovacího řešení. Dnes máme zákazníky po celém světě, od malých až po ty největší. V textu se možná nevyhnu mírné nadsázce, ale po letech v IT mám někdy problém brát věci dostatečně vážně.

Soupeření Microsoftu a VMware

Pojďme si představit současné leadery v oblasti virtualizace serverů - VMware vSphere a Microsoft Hyper-V. Dohromady ovládají přes osmdesát procent trhu, pokud věříte průzkumům.

Nutno hned na začátku zmínit, že aktuální verze obou platforem, tedy vSphere 6.7 a Hyper-V 2019, se k sobě technickými parametry velmi přiblížily. Možná natolik, že oba vendoři cíleně nazývají stejné funkce různými jmény, aby tato skutečnost byla méně očividná. My se ale zmást nenecháme, a přestože moje historie byla dosud převážně spjatá s VMware, pokusím se v klíčových oblastech uvádět oba termíny.

Taktéž zálohovací proces je na obou platformách velmi podobný. Virtuální stroj z pohledu hypervisoru (hostitelského serveru) není nic jiného, než několik málo souborů na pevném disku. Zejména se jedná o soubor konfigurační, který obsahuje popis virtuálního hardware, a soubory obsahující data virtuálních disků. Jednotlivé platformy mají samozřejmě svá specifika, např. VMware ukládá nastavení virtuálního BIOSu do zvláštního souboru, zatímco Hyper-V přímo do hlavní konfigurace. Formát se tedy liší, ale princip je stejný.

O snapshotech a checkpointech

Na první pohled by se mohlo zdát, že pro odzálohování virtuálního stoje stačí vykopírovat soubory, ze kterých se skládá. A je to do jisté míry pravda. Pokud je virtuální stroj ve vypnutém stavu, vykopírování konfiguračních a datových souborů lze považovat za plnohodnotnou zálohu.

Pro zapnuté virtuální stroje má tento přístup jeden zásadní háček. Zvirtualizovaný operační systém, nemaje ponětí o tom, že je kopírován, do svých souborů s klidným srdcem zapisuje. Výsledkem takové "zálohovací" operace je v lepším případě disk v nekonzistentním stavu. V horším případě neobnovitelná změť staronových dat, pro kterou se v IT vžil termín FUBAR.

Moderní hypervisory naštěstí obsahují mechanismy, jak získat neměnný obraz virtuálních disků v daném okamžiku. Ano, jedná se o snapshot, neboli - v terminologii Hyper-V od verze 2012 - checkpoint. Jeho vytvoření je poměrně rychlá operace, která soubor s daty virtuálního disku uzamkne pouze pro čtení. Pro následné zápisy je vytvořen soubor nový, tzv. delta disk. Ten je v momentě vytvoření prázdný, ale s přibývajícími zápisy roste. Teoreticky může dosáhnout až velikosti původního disku, a to v momentě, kdy jsou přepsána všechna data. Z tohoto důvodu je dobré nezaplňovat svá datová úložiště do maxima, ale vždy ponechat dostatek volného prostoru pro snapshoty.

Bystré oko odhalí hned několik problémů se snapshoty. Tím prvním je mírné zpomalení diskových operací uvnitř virtuálního stroje, protože se při čtení nejprve musí podívat do delta disku. Pokud nenajde, dívá se do původního disku, jak znázorňuje obrázek 1. Větším problémem je následné odstranění snapshotu, které, zejména pokud snapshot za dobu své existence nabobtnal, zabere poměrně hodně času a opět ukousne část IO výkonu. Doporučuje se proto snapshoty uchovávat jen na dobu nezbytně nutnou.

Obr. 1: Ccesta IO požadavku se snapshotem
Obr. 1: Ccesta IO požadavku se snapshotem


Přestože samotný snapshot za zálohu rozhodně považovat nelze, je to první krok na cestě k záloze. Získali jsme neměnný obraz virtuálního stroje v daný moment.

 Během jeho vytváření je navíc možné dát zvirtualizovanému operačnímu systému vědět, že proběhne záloha. Tím dostane příležitost například zapsat obsah cache na pevný disk, aby byl souborový systém zamražen v dobrém stavu. Název funkce, quiescence, je zřejmě již natolik obskurní, že je na obou platformách stejný. Správnou výslovnost nezná ani můj kolega z Utahu.

Plné a rozdílové zálohy

Když teď máme snapshot, stačí vykopírovat původní soubory virtuálních disků, že ano?
Inu, ano. První záloha skutečně není nic jiného, než vykopírování konfiguračního souboru a zamražených virtuálních disků. Asi by bylo nepraktické takovou zálohu provádět každý den, virtuální disky bývají veliké, přičemž data na nich se nemusí nutně měnit. Proto hypervisory nabízí možnost sledovat změněné bloky mezi dvěma snapshoty a jakmile jednou máme první plnou zálohu, teoreticky nám stačí dokopírovávat změněná data, viz obrázek 2.

Obr. 2: Kopírování změněných bloků
Obr. 2: Kopírování změněných bloků


Slovo teoreticky uvádím záměrně. Zatímco VMware provozuje tzv. changed block tracking (CBT) již téměř 10 let, v Hyper-V přibyla ekvivalentní funkce s názvem resilient change tracking (RST) až od verze 2016. Je tedy relativně nová a zálohovací aplikace někdy prostřednictvím kontrolních součtů dodatečně ověřují, že nezměněné bloky jsou opravdu nezměněné. To aby dodaly uživatelům pocit jistoty. Anebo proto, že tuto funkci stejně obsahují z dob minulých a není na škodu ji prodat znovu.

Dlužno dodat, že ve VMware CBT se za oněch 10 let existence objevila řada chyb. Ty méně škodlivé rovnou zabránily ve vytvoření snapshotu, takže zálohovací proces končil s chybou. Horší případy zahrnovaly neúplný seznam změněných bloků, při kterých záloha sice doběhla bez viditelných chyb, ale nebyla kompletní. Případná obnova tak často končila oblíbeným FUBAR stavem následovaným všeobecnou panikou.

Přes historické problémy se však jedná o neocenitelnou technologii, která výrazně pomáhá zkrátit zálohovací okno. Pro všechny případy doporučuji jednou za čas vynutit plnou zálohu a dodržovat všechny "best practices", tedy pravidelně aktualizovat hypervisory a testovat obnovu. Při aktualizacích se nevyplatí skákat po nejnovější major verzi hned po vydání, protože chyby v CBT se zpravidla objevily po větších změnách v IO stacku hypervisoru. Opět nacházíme podobnost s Microsoftem - opatrní si počkají na první service pack.

Proces obnovy

Obrovskou výhodou přístupu přes hypervisor oproti klasickému zálohování zevnitř operačního systému je snadná obnova celého stroje. Stačí všechny soubory nakopírovat zpátky na hypervisor a dát mu vědět. Oproti obnově na holé železo se jedná o masivní úsporu času a zvýšení spolehlivosti.

Co už není tak skvělé, je obnova jednotlivých souborů, tabulek či e-mailů. Namísto klasické adresářové struktury totiž zálohovací aplikace vidí pouze pár velkých souborů obsahující data virtuálních disků. Ty je sice možné s trochou snahy připojit jako bloková zařízení, protože je ale drtivá většina zálohovacích aplikací postavená nad Windows, porozumí pouze omezenému počtu souborových systémů. Pokud všechny vaše virtuální stroje běží na Windows, nejedná se o velký problém. V opačném případě jste ale často nuceni pro obnovu jednoho souboru nahodit celý stroj, nebo startovat pomocnou virtuálku s Linuxem.


Jaké zálohovací řešení vybrat?

S přihlédnutím k ceně licencí by člověk očekával alespoň základní zálohování jako nedílnou součást platformy. V případě Hyper-V se dá v malých nasazeních vyžít s Windows Server Backup, ve větších pak se System Center DPM.

VMware oproti tomu oznámil konec produktu VDP (vSphere Data Protection) ve prospěch aplikací třetích stran. Překvapivé to není, VMware spadá do korporace Dell EMC, která nabízí hned několik placených alternativ. Můžete svobodně vybírat i z mnoha dalších, v každém případě ale počítejte s další položkou v rozpočtu.

Já osobně jsem pro VMware nevybral a po letech hledání jsem, ještě coby cloud architekt Master Internet, navrhnul řešení vlastní - VMcom. Kupodivu přečíst celou dokumentaci k API VMware bylo rychlejší než pochopit sedm edicí nejmenované zálohovací aplikace, dohledat partnera v ČR a zjistit koncovou cenu. V ten moment bylo jasné, že VMcom vznikne, edici bude mít jednu a férová cena bude veřejně na webu. Pro umocnění inovátorského efektu je postaven na Linuxu, takže nativně přečte drtivou většinu dnes používaných souborových systémů.

Každopádně ať už zálohujete jakkoliv, doufám, že pro vás byl článek přínosem a že jste si z něj odnesli nějaké nové informace.

Pavel Žák
Autor článku je spoluzakladatelem a CTO společnosti VMcom Systems (https://vmcom.com).

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Konec papírování, digitalizujte a usnadněte si práci!

IT Systems 3/2024V aktuálním vydání IT Systems jsme se zaměřili na vývoj digitalizace ve světě peněz, tedy v oblasti finančnictví a pojišťovnictví. Dozvíte se například, proč je aktuální směrnice PSD2 v inovaci online bankovnictví krokem vedle a jak by její nedostatky měla napravit připravovaná PSD3. Hodně prostoru věnujeme také digitalizaci státní správy a veřejného sektoru, která nabírá obrátky.