- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (79)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
Hlavní partner sekce
Partneři sekce
Tematické sekce
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tiskBranové sekce
![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Partneři webu
IT SYSTEMS 4/2010 , IT Security
Moná jste se ji s přístupem tzv. deduplikace dat sami setkali. O co v ní jde? Představme si jednoduchý příklad. V rámci podniku je rozeslán e-mail s přílohou o velikosti 1 MB (třeba pozvánka na firemní společenskou akci a podobně). Pokud si kadý z adresátů tuto přílohu uloí do svého lokálního úloitě, zabere celkem 500 MB (tedy 500 × 1 MB). Existuje vak relativně snadná monost, jak téměř 499 MB dat uetřit. Jde o to, uloit pouze jeden originál a ostatní umístění stejné přílohy nahradit odkazem na něj. Ba co víc, tento postup funguje i v případě změny originálního souboru, kdy mohou být ukládány právě jen rozdíly oproti originálu. Zde ale záleí také na objemu takových změn, jeliko čím je jich více, tím rychleji metoda deduplikace druhé úrovně ztrácí své výhody.
Rozliujeme proto tři základní druhy deduplikace:
Nástroje pro deduplikaci můeme s ohledem na umístění, kde k deduplikaci dochází dále rozdělit na dvě základní skupiny:
Deduplikace na zdroji přináí (v porovnání s deduplikací na cíli) dalí dvě zásadní výhody. Stejně jako u prvního řeení sniuje objem dat a tím etří místo na úloiti. Navíc výrazně sniuje zatíení sítě (LAN/WAN) a zásadně redukuje čas potřebný k provedení zálohy přenáíme pouze změny. Součástí těchto řeení můe byt i takzvaná globální deduplikace, která je prováděna na úrovni vech dat v prostředí, nikoli pouze na úrovni daného klienta. Systém tedy přenese celý datový fond pouze jednou a potom ji vytváří plné zálohy prostřednictvím inkrementálních rozdílů s tím, e kadá záloha je kompletní (full backup), i kdy se zálohují pouze změny. Tato metoda je ideální pro rozsáhlé virtuální prostředí, centrální zálohování vzdálených poboček nebo centrální zálohování velkého počtu koncových zařízení (PC, notebooky).
Přístup označovaný jako deduplikace dat se v současnosti stává neoddiskutovatelným trendem při zálohování. Nejen, e sniuje zatíení sítě a potřebu úloné kapacity, ale umoňuje i rychlejí obnovu dat. A protoe úspory jsou vdy a na prvním místě, pomáhá významným způsobem sniovat investiční náklady do hardwaru. Nejvhodnějí formu deduplikace je vhodné zvolit na základě realistické analýzy důleité můe být, jak často provádíte plné a inkrementální zálohy, kde je uchováváte a s jakými objemy dat pracujete. Pokud tyto okolnosti vezmete v úvahu, nemůete zvolit patně.
Autor působí jako business unit manager EMC ve společnosti Servodata.
Deduplikace dat fenomén moderního zálohování
Tomá ilar
Společně s neustálým růstem objemu dat i poadavky na jejich ochranu se stále zvyšují i nároky na systémy pro jejich bezpečné zálohování. Tradiční pojetí zálohování přitom naráí na své limity, a výrobci proto musejí hledat nové cesty k uspokojení poadavků svých zákazníků. Co přinášejí monosti moderní deduplikace dat podnikovým uivatelům?

Moná jste se ji s přístupem tzv. deduplikace dat sami setkali. O co v ní jde? Představme si jednoduchý příklad. V rámci podniku je rozeslán e-mail s přílohou o velikosti 1 MB (třeba pozvánka na firemní společenskou akci a podobně). Pokud si kadý z adresátů tuto přílohu uloí do svého lokálního úloitě, zabere celkem 500 MB (tedy 500 × 1 MB). Existuje vak relativně snadná monost, jak téměř 499 MB dat uetřit. Jde o to, uloit pouze jeden originál a ostatní umístění stejné přílohy nahradit odkazem na něj. Ba co víc, tento postup funguje i v případě změny originálního souboru, kdy mohou být ukládány právě jen rozdíly oproti originálu. Zde ale záleí také na objemu takových změn, jeliko čím je jich více, tím rychleji metoda deduplikace druhé úrovně ztrácí své výhody.
Zálohování v centru pozornosti
Ne se začneme věnovat konkrétním trendům v deduplikaci dat, shrňme si nejdůleitějí fakta, se kterými lze setkat při návrzích zálohovacích řeení:- meziroční nárůsty objemu dat přináejí potřebu stále větích kapacit zálohovacích systémů (diskových polí, páskových knihoven a dalích),
- roste podíl kriticky důleitých dat a s ním i poadavky na jejich ochranu a zabezpečení,
- prodluuje se čas nutný k provedení záloh, zároveň se ale zálohovací okno zkracuje,
- roste objem dat na vzdálených pobočkách firem,
- virtualizace infrastruktury přináí zcela nové výzvy pro zálohování.
Jak probíhá moderní zálohování?
Při zálohování dat dochází k mnoha operacím, které jej pomohou zrychlit či lépe zabezpečit. Asi nejznámějí z nich jsou:Komprese
Přináí zmenení objemu dat, a tedy i sníení poadavku na velikost úloitě. Běně se pouívá při ukládání na magnetické pásky, ale zdaleka nejen zde.ifrování
I přes nevýhody, plynoucí zejména z moného zpomalení zálohovacího procesu a obnovy dat, představuje ifrování efektivní způsob ochrany dat proti zneuití.Duplikace
Záloha vzniká ve více umístěních (a například i na různém typu médií) hlavní výhodou je ochrana proti moné ztrátě dat vlivem pokození jednoho z úloi.Deduplikace
Vychází z předpokladu, e není nutno ukládat více instancí stejných dat. Místo kopií je tak ukládán pouze odkaz na originální umístění. Viz také příklad v úvodu článku.Různé monosti deduplikace dat
Moderní deduplikační technologie pracují na souborové či takzvaně sub-souborové úrovni. Zde algoritmus dělí kadý soubor na datové bloky.Rozliujeme proto tři základní druhy deduplikace:
- na úrovni souboru (celé, binárně shodné soubory),
- s konstantní velikostí datového bloku,
- s proměnnou velikostí datového bloku.
Nástroje pro deduplikaci můeme s ohledem na umístění, kde k deduplikaci dochází dále rozdělit na dvě základní skupiny:
- s deduplikací na cíli, kterým je myleno cílové úloitě dat jedná se tedy o technologie integrované do diskových polí, úloi typu NAS, CAS, VTL a dalích,
- s deduplikací na zdroji, respektive na klientovi systém identifikuje redundantní data a minimalizuje jejich mnoství jetě před tím, ne jsou odeslána přes sí (LAN/WAN) k zálohování.
- deduplikační poměr hlavní parametr ukazující úsporu kapacity zálohovacího úloitě,
- zkrácení doby zálohy významný parametr u deduplikace na zdroji (zálohují se pouze změněné části souborů),
- úspora kapacity datových linek, respektive snazí centralizace zálohování dat.
U zdroje, nebo raději a v cíli?
Deduplikace na cíli řeí primárně otázku úspory kapacity zálohovacího úloitě v případě zálohování na disky tedy etří diskovou kapacitu, v případě zálohování na pásky etří kapacitu knihovny, respektive potřebu páskových médií. Málokdy vede ke zkrácení času potřebného pro zálohování, protoe vechna data stejně musí být nejdříve přenesena na cíl. Tato metoda má nicméně univerzální pouití hodí se, pokud má zákazník zájem o deduplikaci záloh, ale v danou chvíli ji pouívá stávající zálohovací řeení a nechce migrovat na jiný zálohovací software.Deduplikace na zdroji přináí (v porovnání s deduplikací na cíli) dalí dvě zásadní výhody. Stejně jako u prvního řeení sniuje objem dat a tím etří místo na úloiti. Navíc výrazně sniuje zatíení sítě (LAN/WAN) a zásadně redukuje čas potřebný k provedení zálohy přenáíme pouze změny. Součástí těchto řeení můe byt i takzvaná globální deduplikace, která je prováděna na úrovni vech dat v prostředí, nikoli pouze na úrovni daného klienta. Systém tedy přenese celý datový fond pouze jednou a potom ji vytváří plné zálohy prostřednictvím inkrementálních rozdílů s tím, e kadá záloha je kompletní (full backup), i kdy se zálohují pouze změny. Tato metoda je ideální pro rozsáhlé virtuální prostředí, centrální zálohování vzdálených poboček nebo centrální zálohování velkého počtu koncových zařízení (PC, notebooky).
Očekávaný vývoj u deduplikace dat
S ohledem na obrovské nárůsty dat se nasazení deduplikační technologie stává standardem u zálohování velkého objemu dat (desítky terabytů a více). Zejména u deduplikace na cíli se budou prosazovat otevřené systémy kompatibilní s řadou zálohovacího softwaru různých výrobců jejich nasazení nebude vyadovat ádný sloitý zásah do stávající infrastruktury. Do budoucna se jeví jako pravděpodobnějí vyuívání systému s proměnnou délkou bloku, protoe dosahuje výrazně vyího deduplikačního poměru.Přístup označovaný jako deduplikace dat se v současnosti stává neoddiskutovatelným trendem při zálohování. Nejen, e sniuje zatíení sítě a potřebu úloné kapacity, ale umoňuje i rychlejí obnovu dat. A protoe úspory jsou vdy a na prvním místě, pomáhá významným způsobem sniovat investiční náklady do hardwaru. Nejvhodnějí formu deduplikace je vhodné zvolit na základě realistické analýzy důleité můe být, jak často provádíte plné a inkrementální zálohy, kde je uchováváte a s jakými objemy dat pracujete. Pokud tyto okolnosti vezmete v úvahu, nemůete zvolit patně.
Autor působí jako business unit manager EMC ve společnosti Servodata.
Chcete získat časopis IT Systems s tímto a mnoha dalími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z naeho archivu.




















