facebook LinkedIN LinkedIN - follow
IT SYSTEMS 12/2018 , AI a Business Intelligence

Datové sklady v digitálním věku

Martin Bém


Digitalizace je současným trendem, který prostupuje prakticky všemi myslitelnými i nemyslitelnými odvětvími. Dle průzkumů společnosti IDG z roku 2018 nějakou formou digitalizace prodělává v současnosti 89 % firem a organizací, ale pouze 44 % se již podařilo alespoň částečně uspět.


Co je digitalizace

Podstatou digitalizace by mělo být zlepšení efektivity procesů pomocí digitálních technologií. Cílem je pak snížení nákladů, zvýšení výnosů, zvýšení zisku. Problémem tohoto termínu je, že původně měl trochu jiný význam a jeho přenesením do oboru managementu získal určitou nežádoucí abstraktnost. V současnosti o digitalizaci všichni mluví, píší, dokonce ji i dělají, ale mnohdy se jedná o naprosto odlišné věci, které mají společné jen to, že nějak souvisejí s digitálními/informačními technologiemi. Přitom technologie jsou pouze jedním z prvků v celé skládačce a je nutno řešit i problémy v podobě procesů, organizace procesů, organizačních struktur, firemní kultury, produkčního řetězce tvořícího hodnotu pro zákazníky atd.

Na co si dát při digitalizaci pozor

Podobně problematický je i přístup, že jedno pojetí digitalizace stačí všem. Jenže digitalizace musí být řešena zcela individuálně, v kontextu každé firmy nebo organizace, protože jinak jsou to jen zbytečně vynaložené finanční prostředky a ztráta času.
Dalším problémem je i často krátkodobý přístup k digitalizačním programům, které jsou ale svým charakterem střednědobé a dlouhodobé.
Termín digitalizace jako celek bohužel eroduje i díky snahám prodávat instantní digitalizaci místo skutečné implementace digitálních řešení. Bez ohledu na tento aspekt má primární poselství digitalizace stále svoji přidanou hodnotu. Je tedy jen otázkou času, než se digitalizace objeví pod novým marketingovým názvem, s jistým typem vnitřní konsolidace obsahu.

Vymezení digitalizačních projektů

Jak si tedy současnou digitalizaci vymezit? Základem je jasně si určit prostředky a aktivity, které souvisejí s aplikací digitálních/informačních technologií, a to ještě takových, které mají nějaké jasně měřitelné přímé ekonomické dopady na celkovou výkonnost firmy nebo organizace. Mnoho digitálních iniciativ tento ekonomický rozměr zcela postrádá nebo omezuje. Často totiž bývá hlavní ukázat nějakou digitalizaci, i kdyby to žádná digitalizace nebyla. Tyto „digitální iniciativy“ koncept digitalizace pouze poškozují a zesměšňují. Co jsou tedy správné prostředky a aktivity?
Za základní prostředky a aktivity digitalizace se dá považovat zavádění nových business modelů včetně některých prvků sdílené ekonomiky, individuální produkty, Business Proces Reengineering, Cloud, Internet věcí (IoT), Big Data, pokročilá datová analytika, automatizace IT, agilní řízení, e-learning, různé typy self-service služeb, Blockchain, umělá inteligence, omnichannel komunikace, optimalizace zákaznické zkušenosti, odstranění zbytných papírových dokumentů z procesů, plnohodnotné enterprise mobilní aplikace, odstraňování legacy aplikací atd.

Bez data managementu neuspějete

Jako červená nit se celou digitalizací proplétá problematika data managementu, který tvoří jeden ze základních kamenů těchto zlepšení a inovací. Data management je přitom mnohem starším oborem a svým způsobem i konzervativnější než samotná digitalizace. Data management sám o sobě v původní podobě není s digitalizací úplně kompatibilní a je potřeba ho v kontextu každé firmy a organizace aktualizovat tak, aby dobře podporoval zvolenou formu digitalizace.

O aktivitách a prostředcích digitalizace najdeme stovky článků se spoustou doporučení, rad a vizí. Občas se najdou i nějaké ty nesmysly nebo zavádějící obchodní materiály, ale to je vlastnost všech aktuálních trendů, ke kterým se chce vyjádřit každý bez ohledu na svoji reálnou kvalifikaci. Výrazně horší je to již s radami pro data management, bez kterého se žádná smysluplná digitalizace dříve nebo později neobejde. Pokud ano, určitě je to něco jiného než digitalizace, navíc ještě se špatným názvem. Je úplně jedno, jestli se o datech budeme bavit jako o novodobém zlatu, ropě nebo vodě, protože bez dat si prostě nelze žádnou digitalizaci představit. Rizika navíc umocňuje fakt, že digitalizace sice slibuje vysoké zisky, ale těch nejde dosáhnout bez zásadnějších počátečních investic, které se velmi snadno mohou stát utopenými investicemi.

Na co se zaměřit

Na co se tedy musí data management zaměřit, aby digitalizace neskončila ve slepé uličce? Je to celá řada domén v čele s Data Governance, datovými platformami, datovou kvalitou, automatizací zpracování dat, rychlejším a kvalitnějším data delivery. Přicházejí nové technologie, nové koncepce, pokročilejší algoritmy, zpracovávají se stále větší datové objemy a zpracovávají se rychleji. Mimo hlavní zájem trochu neoprávněně zůstávají datové sklady, které jsou chápany už jako legacy aplikace, i když tito dinosauři úsvitu informačního věku mají řadu nenahraditelných vlastností, ke kterým se inovativní moderní datové platformy musí teprve propracovat. Navíc i dinosauři byli velcí a mocní, a nebýt jistého drobného incidentu s meteoritem, vládli by planetě Zemi ještě dnes a na nás by nikdy nepřišla řada.

Datový sklad nebo Big Data platforma? Obojí!

Koncept datových skladů vznikl v minulém století. Základní definicí datového skladu je, že se jedná o integrované úložiště dat s orientací na subjekt s nízkou proměnlivostí a historií. Trochu překvapivě původní definice neobsahuje ani slovo o něčem jako relační databáze nebo třeba ETL, které jsou považovány za nezbytné při budování klasického datového skladu. A je to tak správně.
Díky čtvrtstoletí intenzivního rozvoje je datový sklad stále klíčovou komponentou data managementu, bez které si prostě nelze představit smysluplnou digitalizaci (v některých případech k nelibosti řady architektů, jak nám ukazuje praxe). Naprostá většina inovací na poli data managementu v posledních letech totiž řeší technologická omezení datových skladů, nikoliv jejich logické problémy. Opravdu moderně řešený datový sklad dokáže mnohem lépe zajistit toky a zpřístupnění dat než některé čistě technologicky navržené a mnohdy roztříštěné Big Data aplikace, protože až příliš často kladou důraz pouze na aspekt zpracování dat. Moderně pojatý datový sklad Big Data technologie samozřejmě také využívá, jen to dělá mnohem efektivněji.

Jak poznáme moderně řešený datový sklad

Centrální úložiště je jedním z mnoha typů úložišť

Moderní datový sklad logicky vychází z původní definice, navíc se ale rozšiřuje do podoby tzv. enterprise úložiště pro všechna data, která firma nebo organizace potřebuje k analýzám a řízení. Dále takový sklad opouští koncept centrálního datového úložiště v podobě relační databáze, která se stává pouze jedním z mnoha typů úložišť, jako jsou třeba NoSQL databáze nebo Big Data platformy.

Obsahuje Data Lake

Na základě těchto technologií se vytváří zdrojová vrstva v podobě Data Lake, který ale lze využít i samostatně. Všechna technická úložiště jsou logicky propojena a není problém je v jeden okamžik z pohledu koncových uživatelů používat dohromady. Technicky se mluví o datové virtualizaci nebo federaci dle zvolené architektury.

Umožňuje real-time zpracování datových streamů

Další inovací je omezení dávkového zpracování a stále častější zpracování dat v reálném čase v podobě datových streamů. Samozřejmostí je pak centralizovaná správa metadat, data lineage a různé self-service služby pro koncové uživatele.

Počítá s pokročilou analytikou, Machine Learningem a umělou inteligencí

Důležitou součástí je pokročilá analytika dat včetně Machine Learningu a umělé inteligence a je principiálně jedno, jestli se jedná o strukturovaná, semistrukturovaná nebo nestrukturovaná data.

Využívá cloud i open-source technologie

Všechny tyto komponenty jsou maximálně automatizované, což vede k významné úspoře nákladů na vývoj i správu. Úspory se objevují i v oblasti nákupu technologií. Může se jednat o využití cloudu (včetně DWaaS) nebo nasazení open source primárně z oblasti Big Dat. Opomenuti nezůstávají ani koncoví uživatelé, kteří mají mnohem širší možnosti pro datové analýzy, a to navíc rychlejší, nad většími objemy dat i nad větším množstvím datových zdrojů.

Zajišťuje vysokou škálovatelnost

Třešničkou na dortu je pak výrazně lepší škálovatelnost, než měla předchozí generace datových skladů, a to právě díky použití technologií pro Big Data.

Moderní DWH = Extended DWH

Datový sklad je dnes po technické stránce absolutně něco jiného než ještě před několika málo lety a disponuje i mnohem širším využitím. Často se proto termín Enterpise Data Warehouse (EDW) nahrazuje termínem Extended Data Warehouse (XDW), protože záběr EDW je v současném pojetí pro digitalizační programy příliš úzký.
Moderních datových skladů v současnosti existuje naprosté minimum, a to i přes různá prohlášení ať už ze strany IT oddělení, nebo ze strany dodavatelů technologií. Jeho vybudování vyžaduje značnou expertizu a jeho přínosy absolutně převažují nad náklady. Organizace nebo firma dokáže pomocí moderního datového skladu (XDW) výrazně snadněji a rychleji realizovat digitalizační program a dosáhnout tak efektivně svých cílů.

Martin Bém
Autor článku působí jako Senior Consultant ve společnosti Adastra. Aktivně se věnuje návrhu a vývoji datových skladů, Data Governance a datovému modelování, vždy s důrazem na přidanou hodnotu řešení pro zákazníky. Podílel se na řadě projektů datových skladů v České republice i v zahraničí, primárně v oblasti bankovnictví a finanční služeb.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Konec papírování, digitalizujte a usnadněte si práci!

IT Systems 3/2024V aktuálním vydání IT Systems jsme se zaměřili na vývoj digitalizace ve světě peněz, tedy v oblasti finančnictví a pojišťovnictví. Dozvíte se například, proč je aktuální směrnice PSD2 v inovaci online bankovnictví krokem vedle a jak by její nedostatky měla napravit připravovaná PSD3. Hodně prostoru věnujeme také digitalizaci státní správy a veřejného sektoru, která nabírá obrátky.