- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (77)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tisk![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Pracuje s daty a ne s datovým bahnem
Datová platforma, která se naplní datovým bahnem, se změní v datovou bainu. Co pak s ní?
Ve světě přírody je baina oblast nasycená vodou prosycené sladkou vodou skrývající pod pokrývkou raeliny nekonečné tajemství ivota. V digitální dungli naich dní existuje analogie v podobě komplexních hromad nespravovaných dat, kterým říkáme datové bainy (data swamps). Nikdo nechce dobrovolně bydlet v baině. A stejně tak nikdo nechce pouívat podivná, neorganizovaná data, i kdy obsahují digitální otisk naich ivotů. Zapadnout do obou typů bain je problém. Je potřeba mu předcházet, případně ho aktivně řeit, pokud u nastane.

Jak vzniká datová baina?
Datové bainy vznikají velmi snadno. Na začátku obvykle stojí nějaká idea, jak budeme s daty lépe zacházet, lépe je spravovat a na co vechno je vyuijeme. Problém vzniká v dalí fázi, kdy buď nesprávně zvolený nebo příli naivní přístup k data managementu dokáe snadno vyrobit datovou bainu z libovolně kvalitní datové základny. Při analogii s klasickou bainou prostě nefunguje nebo přestalo fungovat datové proudění a vzniká datové bahno.
Některé typy datových platforem jsou díky rigidnějím výstavbovým principům odolnějí ne jejich flexibilní obdoby. Příkladem můe být klasický datový sklad (data warehouse), který má velmi jasně definována pravidla sestavovaná po desetiletí celou řadou teoretiků a praktiků. Jeho seněrovanou a utaenou architekturu je v porovnání s mnohem modernějími a flexibilnějími řeeními typu data lake nebo data lakehouse obtíné v datovou bainu změnit. Ale ani data warehouse se vdycky nedokáe ubránit. Jakmile vznikne datová baina, je u jedno, jestli se původně jednalo o data warehouse, data lake nebo data lakehouse.
Data z ní nelze dál efektivně vyuívat. Původně čistě technický problém se stává obecným, byznysovým problémem s přímými dopady na fungovaní organizace. Datové bahno je hutné, analytické nástroje do datového bahna zapadají a se v něm začnou přímo topit. Cenné informace mizí v datovém chaosu a rizika nekontrolovaně rostou.
Co s datovou bainou dělat?
Tady bahenní analogie končí. Přírodní bahno má, narozdíl od datového bahna, řadu vyuití: na léčebné koupele, balneoterapie, kosmetiku, detoxikaci, hojení ran, zemědělství, stavitelství nebo dokonce umění. Oproti tomu, uitečnost bahna z datové bainy se limitně blíí nule a je potřeba s tím něco dělat.
Někoho moná napadne, e se stačí vrátit ke kořenům data warehousingu a aplikovat vech tisíc základní pravidel. Bohuel takto snadné to není. Datovou bainu je potřeba buď vysuit nebo přeměnit v soustavu propojených datových rybníků. Oba přístupy vyadují zásadní stavební prvek a tím prvkem je data governance. Bez data governace se z datové bainy vyhrabat nelze.

Data governance zatočí s datovým bahnem
Pokud nemáte datovou bainu, patříte mezi astné organizace, které zvládly umění data governance. Je moné, e této vaí schopnosti takto vůbec neříkáte, ale data governance to prostě je. Pokud jste se rozhodli řeit datové odbahnění, je potřeba si data governance osvojit v celé íři, od technologií, přes procesy a lidi a po samotné standardy.
Základním východiskem data governance je datová strategie, která popisuje proč a jak chce organizace pouívat data a hlavně jak z nich chce získat nějakou hodnotu. Bohuel datová strategie je málokdy jasně definovaná. Proto doporučujeme, abyste jí věnovali velkou pozornost.
Na dobrou datovou strategii lze ji navázat data governance. V minulosti se data governance často zaměňovala za řízení datové kvality, větinou v čistě reaktivní reimu. V praxi se někdy také stává, e je data governance zredukována z aktivní schopnosti řídit data na pasivní, velmi dlouhý, vevědoucí dokument. Ten často funguje jako falená modla s formálními přínosy, např. kdy zrovna přijde auditor. Tudy cesta nevede. V dnení digitální době nelze pouívat zastaralé nástroje na nové problémy.
Dobrou data governance poznáme podle toho, e dokáe systematicky přináet přidanou hodnotu. A hlavně pokrývá ji zmíněnou čtveřici oblastí: standardy, technologie, procesy a lidi. Správně pojatá data governance zásadně zlepuje a zefektivňuje data management. ivotní cyklus dat je s ní plně řízený. Odpovědnosti jsou jasně vymezené a pokrývají vechna témata od datové architektury, metadata managementu, bezpečnosti dat, řízení master dat, provozu, datové integrace, datové kvality a technologií.
Odhalování datových bain
Základním pravidlem je se do datové bainy vůbec nedostat. Jak ale odhalit, e se datová baina blíí? Zkuste si odpovědět na následujících deset otázek:
- Máte představu, co a jak chcete se svými daty dělat?
- Víte, jak a k čemu se data pouívají, případně i kdo tato data pouívá?
- Je časově náročné získat data v poadované struktuře?
- Víte, jak data vznikají a jaký je jejich význam?
- Máte aktuální dokumentaci datové architektury?
- Máte metadata popisující datové mnoiny a datové transformace?
- Lze vae data ad-hoc prohledávat a analyzovat?
- Jsou vae data integrovaná, konsolidovaná a kompletní?
- Dokáete určit, které datové procesy vytvářejí hodnotu pro koncové uivatele nebo zákazníky nebo pomáhají řídit rizika?
- Jsou vae data dostatečně kvalitní s ohledem na vae potřeby?
Pokud jste si na větinu otázek odpověděli záporně, datové bahno u bublá. S velkou pravděpodobností u nefalovanou datovou bainu máte, jen o ní jetě nevíte. Bez ohledu na hloubku bainy je potřeba začít jednat.

Jak vysuit datovou bainu?
Plán k vysuení je jasný a přímočarý:
1. Najděte sponzora a vytvořte radu pro data governance (Data Governance Board)
Bez sponzora je kadý program data governance odsouzen k zániku. Kromě zdrojů musí mít data governance i strategický rozměr a její přínosy je třeba komunikovat.
2. Vytvořte svůj vlastní data governance tým
Data governance board řeí celkovou strategii, fakticky se jedná o hlavu celé data governace. Hlava ale nic nezmůe bez svalů. Tyto svaly tvoří specialisté z data governance týmu, kteří zajistí taktické a operativní úrovně řízení data governance od tvorby standardů a po koordinaci datových aktivit přes celou organizaci.
3. Definujte datové domény a jejich vlastníky
Definujte a popite vae datové domény včetně jejich účelu a obsahu. Najděte vlastníky dat na straně byznysu. Pouze vlastníci dat jsou schopni říct, jak mají data vypadat a jakou mají mít kvalitu, aby vůbec mohla být pouita pro dalí zpracování jako jsou analýzy, reporty a jiné výstupy.
4. Sbírejte a integrujte metadata
Metadata jsou kritickým prvek data governance, který umoňuje popisovat data. Kromě struktury dat dokáou metadata popsat i jejich kvalitu, celkovou dynamiku z pohledu zpracování, časových závislostí nebo trendy. Stále populárnějím tématem je celkový pohled na datové toky v podobě data lineage. Metadata také dokáou definovat kontext dat ve vazbě na byznysová pravidla. Doba, kdy lo řeit metadata management pouze pomocí Excelů, dávno skončila. Pouívejte na správu metadat odpovídající moderní nástroje.
5. Katalogizujte data
Katalogizace se provádí pomocí nástrojů označovaným jako datové katalogy. Popisy dat v katalogu dávají uivatelů jasnou představu, jaká data organizace má a s čím lze v organizaci datově pracovat. Kdy je máte, mohou uivatelé místo úmorného a často pokoutného shánění dat trávit více času analýzami s přidanou hodnotou. Katalogizovaná data umoňují také jasnějí vymezení odpovědností.
6. Zajistěte bezpečnost dat včetně přístupových práv
Zabezpečení dat je nutno vdy řeit s jejich vlastníkem s přihlédnutím k celkové strategii datové bezpečnosti a vyuití těchto dat. Zajiuje, aby definovaný bezpečnostní model umonil zpřístupnění datových aktiv pouze oprávněným osobám a procesům. V rámci bezpečnosti vyřete i to, jak vae organizace přistoupí k řízení soukromí dat. Nesmíte zapomenout ani na technologickou stránku věci, která je zásadní pro realizaci a má i velký vliv na efektivitu odbahnění.
7. Automatizujte data i metadata
Kadá rutinní manuální činnost je nejen únavná, ale postupem času má tendenci zhorovat svoji kvalitu nebo zpomalovat. Cílem by měla být maximální automatizace dat a data governance, a to nejen v tradičních oblastech zpracování dat a metadat. Zcela revoluční přístupy pak přináí vyuití technologií jako umělá inteligence (AI) a strojové učení (machine learning), s jejich pomocí lze automatizovat i velmi komplexní problémy spojené např. s dokumentací datové modelu, dotazování dat pomocí datového jazyka nebo detekci datových poloek podléhajících různým regulacím typu GDPR.
8. Nevymýlejte kolo a nezapomeňte na správnou údrbu
Není ádnou ostudou při vysouení nebo přestavbě datových bain pouít zkuenosti někoho jiného a v podobě data governance frameworků nebo externích data governace specialistů, kteří u pár bain viděli a hlavně řeili. Po vyřeení datové bainy je nutné věnovat maximální pozornost údrbě a dodrování vech pravidel, aby se baina nevrátila. Vynaloené úsilí a náklady se ve srovnání s dalím vysouením nové bainy bohatě vyplatí.
Pracuje s daty, ne s datovým bahnem
Z kadé datové bainy se dá uniknout. Otázkou jen je, o jakou a jak nákladnou únikovou cestu se jedná. Nečekejte, a do bainy zcela zapadnete. Data jsou regulérní majetek a je jim potřeba věnovat odpovídají péči, kterou zastřeí data governance. Tato péče se vám násobně vrátí v podobě kvalitnějího rozhodování zaloeného na datech, spokojenějích zákazníků, niích nákladů, lépe řízených rizik nebo vyích treb. Řízená, kvalitní data jsou tím největím bohatstvím organizací.
![]() |
Martin Bém Autor článku působí ve společnosti Adastra, kde se přes 10 let věnuje data managementu a data engineeringu. |





















