- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (79)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tisk![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Úloitě datových skladů a jejich technologická evoluce
S nástupem Big Data technologií se úloitě datových skladů neoprávněně dostala mimo zájem odborné veřejnosti. Přitom i zde dolo v poslední letech k výrazným pokrokům ve výkonových i cenových parametrech.

Zpátky do minulosti
Klasické datové sklady opíraly svůj výkon o velmi drahé klasické magnetické disky, které sice dosahovaly naprosto fantastických parametrů typu 15 000 otáček za minutu a minimálních vyhledávacích časů v řádu jednotek milisekund, ale na úkor relativně malých kapacit a krátké ivotnosti. Aby se zajistil vysoký čtecí a zápisový výkon, řeila se neustále otázka, kam umístit a jak propojit celé armády disků, aby jejich spřaený výkon byl pro komplexní analytické úlohy datových skladů smysluplný. Neexistoval kvalitní datový sklad bez velmi výkonného a drahého rotujícího úloitě. Nejuím místem byl výkon disků a nezbývalo ne nakupovat a instalovat dalí a dalí magnetické disky. Alternativní technologie úloi byly stále nepřipravené, operační paměti drahé, nové softwarové architektury se teprve rodily. Natěstí toto přelapování ve slepé uličce díky řadě faktorů poměrně brzy skončilo.
Big Data odlehčují datové sklady
Jedním z prvních inovačních impulzů byl nástup do jisté míry konkurenčních Big Data technologií, které se ve svých prvních generacích zaměřovaly na sdruování relativně levného hardwaru do softwarových clusterů (např. Hadoop stack). Často se místo nového hardwaru pouíval i starí vyřazený, ale stále funkční. Tato řeení inspirovala datové sklady k několika věcem:
- Nově mohly datové sklady začít efektivně archivovat/off-loadovat data mimo svoje poměrně drahá disková řeení.
- Díky tomu ubyly starosti s neustálým dokupováním nových high-end magnetických disků, a to i přesto, e jejich kapacita postupem času zajímavě rostla a stále jetě roste a do řádu desítek terabytů na kus.
Sice i dříve existovala teoretická brzdná varianta typu cold backup na pásky, ale zcela upřímně vyuitelnost dat uloených na tomto typu médií se z pohledu datové analýzy limitně blíila nule. Dnes u to neplatí. Existují technologie, které umoňují načítat data z pásek transparentně přímo do datového skladu, jen je třeba počítat s relativně velkou časovou latencí analytických dotazů.

Nástup nemagnetických disků
Dalím evolučním krokem byl nástup SSD (Solid State Disk). SSD nahrazují rotující magnetické plotny integrovanými obvody. V principu SSD funguje jako vysoce paralelizované úloitě s okamitým přístupem kamkoliv, zatímco klasický magnetický disk funguje nejlépe v sekvenčních operacích, kdy magnetické hlavičky systematicky pročesávají povrchy rotujících magnetických ploten. Nutno poznamenat, e první generace SSD byla provozně problematická, ale díky technologickým inovacím a kvalitnějím postupům výroby, které zajiují primárně větí mnoství přepisů, SSD postupně nahradily klasické magnetické disky.
Nejprve se SSD vyuívaly jako cache pro magnetické disky:
- Latence SSD je ve srovnání s klasickým magnetickým diskem zlomková.
- Navíc má SSD i výkonnějí zápis a čtení, které zatím nenaráí na fyzikální limity točících se magnetických ploten.
Nasazení SSD v hybridních diskových polích jako doplněk klasických magnetických disků vedlo k razantnímu nárůstů počtu čtecích a zápisových operací a to o několik řádů! A to celé fakticky za zlomkovou cenu ve srovnání s řeením postaveným na hrubé síle hromad spřaených magnetických disků.
Stinnou stránkou SSD byla limitovaná kapacita, často nií ivotnost a vyí cena za uloenou jednotku. Problémy při nasazení SSD v hybridních polích způsobovaly i různé inteligentní algoritmy, které řídily keování SSD, take se občas keovalo něco jiného, ne bylo potřeba (např. aktuální backup místo kritických dat). Bez problémů nebyly ani databáze datových skladů, které se musely nejprve naučit pracovat s SSD a být SSD aware.

Fiber Channel skladům u dávno nestačí
Natěstí se tyto problémy postupem času podařilo odstranit a v současnosti se můete setkat i s diskovými poli sloenými pouze z SSD. SSD navíc postupně ukázaly výkonové nedostatky rozhraní typu SCSI (do této kategorie patří právě i rozhraní typu fiber channel), které bylo prapůvodně koncipováno pro klasické rotující magnetické disky a páskové jednotky. Někdy se fiber channel nahrazuje výrazně modernějím a univerzálnějím rozhraním InfiniBand.
Stále větí nároky na výkon vyvolaly dalí evoluci SSD, které se přesunuly v podobě flash karet blíe procesorům přímo do datových sběrnic typu PCI Express. Zajímavým vedlejím efektem tohoto přímého přístupu je pokles zátěe procesoru díky mení reii diskových operací. V současnosti se flash karty vyuívají jako cache pro jiná pomalejí zařízení nebo jako primární úloitě. Důleitým závěrem je, e se klasický koncept sdíleného diskového pole v prostředí datového skladu přeil a standardem jsou úloitě částečně nebo plně postavená na SSD a flash kartách vyhrazených pro servery datového skladu.

Zrození appliancí pro datové sklady
Nástupu samotných flash karet ale předcházela jetě jiná zajímavá inovace, a to nástup appliancí pro datové sklady, které v sobě integrují výpočetní sílu i datové úloitě, které je nejen optimalizované pro provoz datového skladu, ale navíc je pro datový sklad i plně dedikované, a nemůe tak docházet k degradaci výkonu z důvodu konkurence jiných aplikací. Obecně diskové pole prostě nejde optimalizovat na vechny typy operací, a proto je vhodné pouívat jednu sadu disků pro primární systémy a druhou pro analytiku. Dále integrace úloitě a výpočetní síly umoňuje celou řadu architektonických a softwarových optimalizací, které u obecně postavených řeení nelze zrealizovat. Fakticky se jedná o správné vyváení výpočetní síly a rychlosti datového úloitě, aby se vzájemně zbytečně nepředbíhaly, podporu pro různé typy horizontální a vertikální kálovatelnosti a v neposlední řadě sjednocení managementu celého řeení. Navíc appliance mohou přirozeně vyuívat flash karty. Flash karty tak ve výsledku povýily appliance pro datové sklady do zcela nové výkonové třídy a přinesly výkon, který bychom před pár lety povaovali za sci-fi.

Kadému to nejsprávnějí datové úloitě!
Dalím evolučním krokem je neustálé zlevňování operačních pamětí v kombinaci s jasně definovanou paměovou hierarchií. Díky tomu mohou databáze datových skladů zpracovávat více dat v paměti a nečekat na pomalejí trvalá datová úloitě (i kdy díky flash kartám u vůbec nemusí být pomalá). Díky softwarovým inovacím lze operační pamě pouívat pro větí mnoství dat díky sloupcovým uloením a datové kompresi.
Paměová hierarchie datového skladu ukládá data do operační paměti a dále je kopíruje do méně výkonných úloi pro zajitění trvanlivosti. Ostatní důleitá data tak mohou být dostupná na velmi rychlých flash kartách nebo SSD a méně důleitá data mohou být na klasických pomalých magnetických discích. Data, která se nevyuívají v datovém skladu, mohou být uloena na páskách v moderních páskových knihovnách, které tato data dokáou na vyádání zpřístupnit bez zásahu administrátora. Alternativně mohou být pásky nahrazeny konceptem rozmrazených pásek pomocí Big Data technologií.
Popření klasické architektury počítačů
Aktuální inovací jsou opravdu pouitelné paměti typu NVRAM. Tento typ paměti kombinuje rychlost operační paměti s perzistencí a kapacitou, kterou přináejí například flash karty. NVRAM se v blízké době budou nasazovat jako specializovaná cache mezi operační pamě a datové úloitě. Udává se, e NVRAM má a 20x nií latenci ne u tak velmi rychlá flash karta. Take se opět těme na nárůst výkonu datových skladů.
Nástup NVRAM v blízké budoucnosti naruí tradiční von neumannovskou architekturu počítačů, kterou pouíváme prakticky od konce 2. světové války. Je jen otázkou času, kdy dojde k poklesu ceny NVRAM na takovou úroveň, aby dolo k opravdové revoluci nejen na poli úloi datových skladů. Princip NVRAM boří některá základní paradigmata ve tvorbě současného softwaru. Zdá se, e datové sklady budou jedna z prvních oblastí, kde se NVRAM skutečně prakticky prosadí.
Dočkáme se ivých pamětí?
NVRAM vak není ádná konečná a ve vzdálenějí budoucnosti se můeme těit na paměti na principu DNA. Jejich současná udávaná kapacita je stovky petabytů (!) na gram při ceně jednotek tisíc dolarů za megabyt. Prozatím, i přes obrovský potenciál, jsou tyto vysokokapacitní paměti velkým otazníkem a jejich komerční vyuití není na pořadu dne.
![]() |
Martin Bém Autor článku působí jako Senior Consultant ve společnosti Adastra. Aktivně se věnuje návrhu a vývoji datových skladů, Data Governance a datovému modelování, vdy s důrazem na přidanou hodnotu řeení pro zákazníky. Podílel se na řadě projektů datových skladů v České republice i v zahraničí, primárně v oblasti bankovnictví a finanční slueb. |





















