facebook LinkedIN LinkedIN - follow
Tematické sekce
 
Branžové sekce
Přihlášení SystemNEWSPřehledy
 
Tematické seriály

Jak uřídit IT projekt a nezbláznit se

Užitečné tipy a nástroje pro řešení problémů řízení inovací a vývoje produktů...

články >>

 

Industry 4.0

Průmysl 4.0

Jaký vliv bude mít čtvrtá průmyslová revoluce na výrobu a výrobní firmy?

články >>

 
Nové!

RPA - automatizace procesů

Softwaroví roboti automatizují obchodní procesy.

články >>

 
Nové!

IoT – internet věcí

Internet věcí a jeho uplatnění napříč obory.

články >>

 
Nové!

VR – virtuální realita

Praktické využití virtuální reality ve službách i podnikových aplikacích.

články >>

 
Nové!

Bankovní identita (BankID)

K službám eGovernmentu přímo z internetového bankovnictví.

články >>

 

Příručka úspěšného IT manažera

Dnes je řada IT manažerů opomíjena. Úspěšní bývají brouci Pytlíci a Ferdové...

články >>

 
 
Partneři webu
IT SYSTEMS 12/2014 , ITIL – Řízení IT

Souborový systém ReFS



Microsoft, KPCSSvětu Windows již více než dvacet let vládne souborový systém NTFS a určitě ještě dlouhou dobu bude. Nicméně dnešní IT svět se rychle mění a požadavky na systémy pro ukládání dat se mění s ním. Klíčovým požadavkem je dnes ukládat dříve nepředstavitelně velké objemy dat s co nejnižšími náklady a zároveň garantovat vysokou spolehlivost přístupu k těmto datům. Zde již ale narážíme na limity NTFS, které vznikalo v jiné době a s jinými vstupními požadavky na celkový návrh. Proto Microsoft začal jako součást Windows Serveru 2012 rozvíjet nový souborový systém ReFS (The Resilient File System), který má nahradit NTFS v některých scénářích, ve kterých NTFS již dochází dech.


ReFS byl primárně vytvářen s ohledem na spolehlivost, kompatibilitu a škálovatelnost. S novými verzemi Windows se ReFS postupně vyvíjí a bude postupně pokrývat stále více scénářů použití.

Doporučené scénáře nasazení ReFS

Primární doporučené scénáře pro použití ReFS míří do oblastí ukládání velkého množství dat na levnějších a potenciálně méně fyzicky spolehlivých discích, obvykle archivace souborů, knihoven VHDX souborů, uložení záloh atp. v těchto konfiguracích:

  • Standardní souborový server postavený na levnějším úložišti s vysokou kapacitou - Serial ATA (SATA) nebo Serially Attached SCSI (SAS) disky v konfiguraci JBOD.
  • Konsolidované úložiště dat aplikací - scale-out souborový server v clusteru, kdy je použita technologie Storage Spaces nad sdílenými SAS disky v konfiguraci JBOD.

ReFS byl vyvíjen jako doplněk k technologii Storage Spaces, která umožňuje agregovat dostupné fyzické disky v konfiguraci JBOD, nastavit ochranu proti výpadku disku typu Mirror Spaces (obdoba RAID-1) nebo Parity Spaces (obdoba RAID-5) a virtualizovat jejich prezentaci směrem k vlastnímu operačnímu systému. ReFS je možné použít nezávisle na Storage Spaces, nicméně kompletní množinu přínosů ReFS využíváme právě v této kombinaci. Od Windows 8.1 je ReFS k dispozici také v rámci klientského operačního systému, ale jen pro konfiguraci se Storage Spaces v režimu Mirror Spaces.

Architektura ReFS – klíčové vlastnosti

Struktura dat na disku

ReFS používá pro uložení všech metadat i souborových dat B+ stromy. Veškeré uložené informace jsou organizovány do propojených tabulek podobných relační databázi. ReFS tak využívá vysoké efektivity prohledávání B+ stromů. Praktickým důsledkem zvolené strategie je vysoká škálovatelnost a mnohem rychlejší přístup k rozsáhlým souborovým systémům s vysokým počtem souborů a košatou adresářovou strukturou. Týká se to i velkých souborů, které se skládají z velkého množství fragmentů. Jiné souborové systémy včetně NTFS při práci s takto fragmentovanými soubory na rozdíl od ReFS rychle ztrácí na výkonu.

Metadata souborového systému

Metadata souborového systému jsou distribuována přes celý oddíl formátovaný pomocí ReFS. Toto je v přímém kontrastu s centralizovaným modelem uložení většiny metadat, který je používán NTFS v rámci MFT - Master File Table. Všechna metadata jsou na úrovni stránky B+ stromu navíc opatřena 64-bitovým kontrolním součtem a tento kontrolní součet je uložen v jiné části disku než samotná metadata. Díky tomu je možné kdykoliv detekovat poškození metadat a pokusit se problém automaticky opravit.

Zápis metadat (Copy-On-Write)

Integrita je vždy zajištěna nad metadaty souborového systému tím, že kromě existence kontrolních součtů se aktualizovaná metadata vždy zapisují na jiné místo disku, než byla metadata původní, a teprve po jejich úspěšném a atomickém zpracování dojde k zneplatnění těch předchozích. Jinak řečeno - v každém okamžiku má souborový systém možnost se vrátit do konzistentního stavu. Je to velmi efektivní ochrana konzistence metadat proti neplánovanému výpadku systému bez nutnosti žurnálování transakcí, které používá NTFS. Navíc se metadata zapisují ve větších I/O dávkách, což je rychlejší než přepisovat různě umístěné fragmenty.

Co ReFS přináší?

Škálovatelnost

Množství dnes ukládaných dat roste raketovou rychlostí, a proto byl systém ReFS vytvořen tak, aby bez dopadu na výkon uměl pracovat s extrémně velkým objemem dat. Např. maximální velikost oddílu má u ReFS hranici 1 Yottabajt (1 kvadrilión Gigabajtů) a maximální velikost jednoho souboru je 18 exabajtů.

Integrita

Způsob ukládání dat je v rámci ReFS navržen tak, aby souborový systém sám dokázal detekovat problém s integritou a v případě zjištění takovéto chyby spustil sám opravnou akci. Zároveň je možné volitelně zapnout i integritu datovou, a to nad celým svazkem, složkou či konkrétním souborem. Datová integrita je automaticky zapnuta při kombinaci se Storage Spaces v konfiguraci Mirror Spaces a v případě Windows Server 2012 R2 a vyšší i pro Parity Spaces. Při detekci poškození dat tak souborový systém automaticky provede záchranu dat z alternativní kopie, kterou poskytnou Storage Spaces.

Zapnutí datové integrity ale má samozřejmě přece jen negativní dopad na výkon primárně zápisových operací, a proto je tato funkce plně konfigurovatelná. Zapnutí či vypnutí datové integrity se nastavuje:

  • při formátování oddílu příkazem format P: /fs:refs /i:enable nebo nově pomocí PowerShellu Format-Volume -DriveLetter P -FileSystem ReFS -SetIntegrityStreams $true
  • nebo je možné tuto ochranu zapnout pro konkrétní soubor Set-FileIntegrity -FileName '"P:\KPCS\ClanekOReFS.docx"' -Enable $True nebo třeba celou složku Get-Item -Path 'P:\KPCS\*' | Set-FileIntegrity -Enable $True
Obrázek 1: Zapnutí datové integrity v rámci ReFS
Obrázek 1: Zapnutí datové integrity v rámci ReFS

Dostupnost

ReFS se prioritně soustřeďuje na dostupnost uložených dat. Pokud se detekuje chyba, ihned následuje automatická oprava ze záložní kopie. Pokud není možné data automaticky obnovit, dojde k jejich zneviditelnění v rámci souborového systému. Z pohledu uživatele či aplikace tak soubor v podstatě zmizí. Cílem této akce je žádným způsobem neovlivnit přístup k nepoškozeným datům a zároveň dát příležitost správci ihned soubor obnovit ze zálohy. Díky tomuto způsobu řešení potíží již není vůbec nutné používat nástroj chkdsk, jehož použití nad velkým svazkem vždy znamenalo poměrně dlouhou nedostupnost dat. Operační systém nám ho proto ani neumožní oproti ReFS svazku spustit.

Obr. 2: ReFS již nepotřebuje chkdks
Obr. 2: ReFS již nepotřebuje chkdks

 

Kompatibilita

Pro zajištění maximální možné zpětné kompatibility s aplikacemi, které umí pracovat s NTFS, byla při tvorbě ReFS využita podmnožina kódu NTFS převážně v oblasti sémantických pravidel, rozhraní směrem k operačnímu systému včetně API. Zároveň ReFS implementuje i řadu pokročilých funkcí NTFS, jejichž přehled je uveden v tabulce – viz obrázek 3.

Obr. 3: Srovnání funkcí NTFS a ReFS
Obr. 3: Srovnání funkcí NTFS a ReFS


Co ReFS neumí a nepodporuje

Je potřeba se zmínit i o známých omezeních ReFS. Mezi ty nejdůležitější patří:

  • Vyměnitelná média nemohou využít formát ReFS
  • ReFS nenabízí datovou deduplikaci, EFS, kompresi ani diskové kvóty
  • ReFS je určen pro datové disky. Systémový či bootovací oddíl s ReFS není podporován
  • Active Directory databáze ani SYSVOL také nemohou být uloženy na ReFS oddílu

Shrnutí

Je zřejmé, že ReFS díky své moderní architektuře přináší hned několik silných důvodů, proč ho aktivně využívat. Především přináší spolehlivost s maximální dostupností, vysokou škálovatelnost bez větších negativních dopadů na výkon. Nicméně je potřeba zároveň zřetelně dodat, že ReFS nemá alespoň v tuto chvíli ambice stát se kompletní náhradou osvědčeného souborového systému NTFS. Je určen jen pro konkrétní doporučené scénáře, které NTFS již nedokáže plnohodnotně zvládnout. Ideálním scénářem je jednoznačně kombinace ReFS se Storage Spaces.

Miroslav Knotek

Autor článku, Miroslav Knotek, působí ve společnosti KPCS CZ, s.r.o.

 

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Video, se kterým konečně pochopíte rozdíl mezi běžným a moderním úložištěm

DellI mezi IT specialisty stále převládá názor, že datové úložiště je komodita. Dochází místo? Dokoupíme další diskové pole. Opak je ale pravdou. Moderní datová úložiště mají řadu funkcí a schopností, které uživatelům poskytují zajímavé konkurenční výhody.