facebook LinkedIN LinkedIN - follow
IT Professional - IT Security I , ITSM (ITIL) - Řízení IT , Cloud a virtualizace IT

Virtualizace dat

Jakub Matoušek


Dnešní doba si klade stále vyšší nároky na úložnou kapacitu. Společnostem každoročně narůstají data o více než 50 %, což se nutně musí odrážet v investicích do nových vysokokapacitních diskových úložišť. Nové diskové úložiště je finančně velice náročná záležitost. Společnosti se dostávají do situace, kdy musí řešit dvě otázky: jak pořídit co nejlevněji další diskový prostor a co udělat se starším a mnohdy kapacitně nevyhovujícím datovým úložištěm. Těžko se může nechat ležet „ladem“, či rovnou ekologicky zlikvidovat. Společným východiskem se může stát řešení postavené na virtualizaci dat.


Tímto způsobem je možné dát na jednu stranu starší a těžko škálovatelné diskové prostory s novými výkonnými systémy na straně druhé. Virtualizace umožňuje zpřístupnit serverům veškerou diskovou kapacitu v rámci jediného prostoru – storage area network (SAN). Tohoto systému je možné využít pro migraci podnikových dat ze starších úložných systémů na nové, generačně modernější. Pro virtualizaci je nutné mít dedikovaný virtualizační server (controller), který přímo obstarává službu virtualizace, přičemž některé moderní diskové systémy mají již tento virtualizační server implementovaný v sobě. Virtualizační server slouží k jednoduchému poskytování diskového prostoru serverům a zároveň spravuje veškerá datová úložiště v síti. Říkáme-li veškerá, máme na mysli datová úložiště různých výrobců, například IBM, Hitachi, SUN, HP, EMC apod. S tímto je spojená významná výhoda tohoto systému, totiž jednotná správa v jednotném administračním rozhraní.

Virtualizace – k čemu slouží?

Virtualizace je jednoduchý nástroj pro komunikaci mezi servery a diskovými poli. Virtualizační server má schopnost vytvořit logické jednotky (LUN) napříč diskovým polem a tyto LUNy různým způsobem kombinovat a spojovat, čímž zároveň vytváří virtuální logické jednotky. Nově vzniklé virtuální logické jednotky jsou následně poskytovány serverům. Tato funkcionalita umožňuje pracovat s různými logickými jednotkami na různých diskových polích, pracovat s daty a přesouvat je, rozšiřovat logické jednotky o další kapacity se zapojením nových datových úložišť.
Virtualizaci lze použít v prostředích, která nedovolují svému vlastníkovi rozšiřovat svůj datový prostor o další kapacitu. Standardní SAN architektura má mnoho omezení zabraňující efektivně využívat veškerý potenciál, který disková úložiště nabízejí. Těmito omezeními rozumíme kapacitu, konektivitu, možnost jednotného managementu, zatížení, dostupnost atd. Virtualizace pracuje s datovými úložišti daleko efektivněji a tyto nedostatky eliminuje.
Pohodlnou konfigurací, škálovatelností a možností využít svá stávající datová úložiště zcela zřejmě dochází k úspoře nákladů na pořízení a správu podnikových diskových úložišť.
Pojem virtualizace znamená proaktivní přístup k práci s datovým úložištěm a pokrokový systém, který se nesoustředí pouze na řešení stávajících problémů, ale má potenciál přizpůsobit se novým dynamicky rostoucím technologiím. Virtualizace dokáže v rámci SAN architektury bez problémů pracovat s novými servery, novými datovými úložišti, ale i novými technologiemi. Mezi tyto řadíme technologické propojení s FC, iFC, iSCSI apod. Možností kombinace těchto technologií získáváme vyšší dostupnost a bezpečnost podnikových dat, snadnou škálovatelnost, jednoduchou a jednotnou správu a možnost definovat QoSS (quality of storage services).

Různé modely virtualizace

Rozlišujeme několik modelů virtualizace. První z nich je možnost virtualizace na straně host systémů. Jde o virtualizaci postavenou na principu LVM (logical volume management). Funkčnost virtualizace je implementována na serverech – v host systémech. Tato metoda je naprosto flexibilní a použitelná pro jakékoliv storage zařízení. Toto řešení je vhodné pro vytváření softwarových RAIDů, on-line rozšiřování diskového prostoru a je možné využít i redundance v podobě duálních přístupových cest, podobně jako serverových clusterů. Další výhodou je možnost provádět point-intime snapshoty, synchronní (real-time) i asynchronní mirroring.
Další možností je virtualizace přímo na straně datových úložišť. Tato možnost je dostupná u moderních vysoce výkonných storage zařízení a probíhá přímo v nich samotných, kde zároveň efektivněji využívá jejich zdrojů. Metoda zlepšuje spolehlivost, bezpečnost a dostupnost storage zařízení a je použitelná pro velký počet heterogenních host systémů.
Rozšířeným způsobem jsou tzv. in-band a out-band virtualizace v síti. In-band virtualizace pracuje mezi server/host systémy a datovými úložišti. Je vhodná pro práci s heterogenními storage zařízeními stejně jako s heterogenními host systémy, vše s možností jednotné správy pomocí centrálního managementu. Umožňuje přidělování prostoru dle aktuálních potřeb, on-line rozšiřování prostoru, point-in-time snapshoty, synchronní (real-time) i asynchronní mirroring včetně možnosti použít duálních přístupových cest a clusterů. Out-band virtualizace pracuje na opačném principu – je umístěna mimo server/host systémy. V tomto případě musí mít každý agent instalovaný vlastní software. Toto řešení se využívá zejména v případech nutného oddělení dat od řídících příkazů.

#

 

Virtualizační server

Virtualizační server (controller) je dedikovaný server pro práci s jednotlivými LUNy. Umožňuje propojení těchto logických jednotek od různých výrobců diskových úložišť a vytvářet vlastní virtuální jednotky, tzv. VLUN. Tyto jsou následně nabízeny serverům v prostoru SAN architektury.
Hojně využívanou funkcionalitou, která dnes představuje základní bezpečnostní řešení v rámci podnikových dat, je vzdálená replikace dat, respektive mirroring. Tato replikace se provádí mezi controllery, nezáleží zde na výrobci a předpokladech vlastních diskových úložišť v rámci odlehlých lokalit. Toto řešení je typické pro heterogenní SAN sítě, kde jsou jednotlivé lokality propojeny do jediné SAN sítě prostřednictvím technologie fibre channel (FC). Toto řešení představuje nejjednodušší formu zálohy dat, pomocí zrcadlení jsou ve dvou geograficky oddělených lokalitách stejná data. S použitím FC technologie je potřeba počítat s vyššími náklady na pořízení.

Replikace dat za využití virtualizace

Replikace ve dvou geograficky oddělených lokalitách je velice podobná replikaci na úrovni diskových úložišť. Vzdálená replikace může probíhat mezi stejnými nebo různými systémy. Funkcionalitu vzdáleného zrcadlení můžeme nalézt v nabídce mnoha výrobců, ale tito výrobci rozhodně nehledí na kompatibilitu s konkurenčními řešeními. Mnohdy se stává, že i ve vlastních řadách mohou při pokusech o replikaci nastat problémy. Pokud je ale využita technologie virtualizace s pomocí replikačního serveru, je možné bez ohledu na výrobce či rozdílné typy diskového úložiště pohodlně využít veškerých výhod tohoto řešení. Virtualizační server zprostředkuje vzdálené zrcadlení mezi primární a záložní lokalitou v obou dostupných režimech, synchronním i asynchronním. Spolehlivost synchronního režimu zajišťuje virtualizační server pomocí zpětného ověřování o zapsání informace na záložní lokalitě. Teprve pokud je potvrzen zápis na obě lokality, server zprostředkuje tuto informaci. Při asynchronním režimu se nehledí na potvrzení zápisu ze záložní lokality, replikace probíhá přírůstkově na základě předem daného scénáře. Ve všech případech replikace probíhá na úrovni disků, nikoli na úrovni operačního systému. Pro synchronní replikaci dat se obecně doporučuje využít technologie s použitím optického vlákna (FC) a to do vzdálenosti zhruba sto kilometrů, přičemž musí být brán zřetel na nutnou šířku pásma s maximální dostupností. Pro delší vzdálenosti je též možné využít FC technologii, ale zde se již doporučuje využít asynchronního režimu. Další možností pro synchronizaci na větší vzdálenost může být použití přenosu pomocí IP protokolu.

Vzdálená replikace pomocí IP sítí (iSCSI)

Pokud je nutné replikovat data na neomezenou vzdálenost, je vhodné využít možností IP sítí. I zde je nutné počítat s předpokladem maximální šířky pásma, které je třeba vyčlenit pro potřeby synchronizace dat. Z tohoto důvodu se doporučuje učinit prvotní replikaci na úrovni lokálních diskových úložišť pomocí FC technologie a teprve následně replikovat tato data na vzdálenou lokalitu. Zde je vhodné využití asynchronního přenosu, kde se zapisuje pouze přírůstkově. Pro přenos dat na delší vzdálenosti se obvykle doporučuje využít protokolu iSCSI (Internet Small Computer System Interface) nebo iFCP (Internet Fibre Channel Protocol).
Možnost propojení SAN sítě s technologií vzdálené replikace za pomoci iSCSI protokolu zajišťuje bezpečnost dat a zároveň snížení nákladů na jejich ochranu. Data jsou přitom neustále dostupná ve dvou geograficky odlehlých lokalitách. Stávající SCSI nebo FC zálohovací zařízení lze využít pomocí iSCSI switchů a následně propojit stávající FC-SAN a iSCSI IP-SAN.
Práce s iSCSI je velice obdobná jako ostatní zmíněné zejména IP technologie, není tedy nutné vynakládat další prostředky na zaškolení obsluhy. Další výhodou iSCSI je stejný princip zabezpečení a management jako u stávajícího IP, administrátorům stačí dosavadní zkušenosti s provozem IP sítí.

Fungování iSCSI a iSCSI SAN

Pro správné pochopení využití iSCSI je nutné vysvětlit si, co vlastně protokol iSCSI představuje. Jedná se o technologii, která zprostředkovává SCSI komunikaci na úrovni IP protokolu. Tímto způsobem je umožněn přístup k SCSI zařízením či datovým úložištím po stávající IP síti. Možnosti, které technologie iSCSI přináší, představují společnou technologii pro přenos a úschovu dat. Zařízením zprostředkovávajícím komunikaci mezi těmito technologiemi je tzv. iSCSI převodník. iSCSI převodník je prostředkem dostupnosti pro klasický ethernet a přístup k lokálním stanicím. Pomocí iSCSI převodníku je možné komunikovat na velkou vzdálenost například za využití WAN sítí, kde je již vzdálenost prakticky neomezená. Z tohoto výčtu je zřejmé, že iSCSI technologii nezáleží na jediné platformě, ale kombinací různých topologií efektivně pracuje s ukládáním dat a jejich konsolidací v rámci rozsáhlých datových úložišť.
iSCSI technologii je možné použít v mnoha směrech. Základním požadavkem obvykle bývá konsolidace dat a zefektivnění přístupu k datům, stejně jako možnost mít kompletní dohled nad vlastněnými daty a jejich jednotný management. Tyto funkčnosti doplňuje možnost replikace dat, jejich zálohování na úrovni fyzických zařízení a network boot pro systémy s požadavkem na vysokou dostupnost dat. Tyto vlastnosti dohromady představují iSCSI Storage Area Network.
iSCSI SAN je prostředí využívající IP sítí. Jeho vhodné uplatnění je ve středních instalacích s jasnými požadavky na jednotné datové úložiště, zálohování a obnovu dat. Z popisu iSCSI vyplývá, že jednou z největších předností je možnost instalace geografického clusteru za přijatelnější náklady, než je tomu v případě klasické FC technologie. Pro technologii iSCSI je přirozené vytvářet geografické clustery, provádět vzdálené replikace a disaster recovery.
Technologie iSCSI SAN přináší jistou budoucnost pro dostupnější a zároveň vysoce spolehlivou ochranu podnikových dat. Oproti nákladnější technologii FC SAN využívá stávající infrastruktury a náklady na pořízení jsou minimální.

Proč právě virtualizace a iSCSI

Obě tyto technologie přinášejí vysokou dostupnost a zásadním způsobem snižují náklady. Obvykle není snadné zbavit se zastaralých úložných zařízení a místo nich pořídit nová, vysoce výkonná zařízení, o kterých je předem známo, že za pár let mohou být v podobné situaci. Využitím datových prostor v souladu s moderními technologiemi za pomoci virtualizace lze dosáhnout požadovaného výsledku a minimalizovat náklady. Stejné pravidlo platí pro využití stávajících IP sítí. Firma, která si nemůže dovolit optickou infrastrukturu, může dosáhnout vysoké dostupnosti a spolehlivosti za použití stávající infratruktury. Ve spojení těchto dvou předpokladů lze splnit to, co je pro většinu firem nejdůležitější, a to bezpečné uložení dat.

Autor pracuje jako produktový specialista ve společnosti Unicorn.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Modernizace IS je příležitost přehodnotit způsob práce

IT Systems 4/2025V aktuálním vydání IT Systems bych chtěl upozornit především na přílohu věnovanou kybernetické bezpečnosti. Jde o problematiku, které se věnujeme prakticky v každém vydání. Neustále se totiž vyvíjí a rozšiřuje. Tematická příloha Cyber Security je příležitostí podívat se podrobněji, jakým kybernetickým hrozbám dnes musíme čelit a jak se před nimi můžeme chránit. Kromě kybernetické bezpečnosti jsme se zaměřili také na digitalizaci průmyslu.