- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (79)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tisk![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Master data management v kapse, v bance, v budoucnosti...
Master data management je vude kolem nás, jen si to často nepřipoutíme. Neřeí ho jen velké organizace, které zpracovávají mnoho dat, ale kadý člověk ve svém kadodenním ivotě. Nevěříte? Třeba vás přesvědčím.

Jedna z mnoha definic master data managementu říká, e jde o snahu organizace vytvořit jediný a hlavní referenční zdroj pro vechna důleitá obchodní data, co vede k méně chybám a méně redundancím v obchodních procesech. Velmi zajímavá je ale otázka, co to konkrétně představuje v praxi. Je mnoho způsobů, jakými lze master data management přiblíit. Ideální je usadit problematiku do oblasti, ve které se vichni dobře orientují. V dnení době má skoro kadý z nás mobilní telefon, tak zbývá jen zjistit, zda jsou i zde nějaké problémy, které by mohlo řeit MDM v kapse. Přesuňme se ale k MDM v bance. Na základě získaných informací se pobavíme obecně o MDM oblastech a na závěr si trochu zaspekulujeme o tom, jak by mohlo vypadat MDM v budoucnosti.
MDM v kapse neboli v mobilu
Polome si základní otázku: jaká data máme ve svém mobilním telefonu? Dnes u skoro vechna, take je spí jednoduí odpovědět, jaká data tam jetě nemáme. Pojďme se tedy podívat na úplný základ. Telefon v dobách svého mládí slouil předevím k telefonování. Zaměřme se jen na telefonní čísla a informace s nimi spojené.
Telefonní kontakt se vyvíjel. V době, kdy existovaly jen pevné telefony, jste potřebovali externí kartotéku, v ní byly abecedně řazeni vlastníci telefonního čísla a samotné číslo. Časy se mění, klasický bloček u telefonu a telefonní seznam v kadé telefonní budce si pamatuje čím dál méně z nás. S nástupem mobilních telefonů se tyto informace začaly uchovávat přímo v přístroji a tím se začala psát historie elektronické správy dat. Zpočátku byl prostor pro popis telefonního čísla značně omezen na pár znaků. Neexistovalo rozliování jednotlivých atributů, jako jsou jména, příjmení, adresy, e-maily atd. Vechna data jste měli uloená na telefonní kartě (SIM). Kontaktů mohlo být jen omezené mnoství (řádově stovky).
Časem jste si pořídili mobil, který umoňoval kontakty uchovávat přímo v paměti telefonu, take dokázal zobrazit kontakty ze dvou zdrojů dat najednou. Vy jste původní kontakt na dědečka rozířili o jméno a příjmení a datum narození. Někdo si původní kontakt na SIM kartě ponechal, někdo ne. Dědeček zavolal a na některých telefonech se objevilo, e volá dědeček, na jiných e volá Novák Frantiek. To, e dědeček je Frantiek Novák, jste bohuel věděli jen vy, a ne přístroj sám. Následně dědeček přeel k jinému telekomunikačnímu operátorovi, a tím si změnil telefonní číslo. Zapomněl vám to říct, ale natěstí jeho nové číslo znala vae manelka a zaslala vám ho jako vizitku. Vizitka zněla na jméno Děda Franta. Vy jste si ji rychle naimportoval a volal dědovi. Konsolidaci jste si nechali na později. Jak el čas, tak vám Android nabídl efektivně zálohovat svoje kontakty do cloud úloitě, tak jste tuto slubu přivítali a pravidelně zálohovali. Velmi praktické se ukázalo pouít stejné centrální úloitě, kdy jste si pořídili dalí SIM do automobilu.
MDM v mobilu
Bohuel jednoho dne vám telefon spadl na zem a u nenaběhl. V tu chvíli jste byli astni, e máte kontakty uloené centrálně v cloudu. U méně nadeni jste ale byli, kdy jste zjistili, e po kadé obnově z úloitě se vám v telefonu záznamy duplikují. Na chvilku vás napadlo ručně spravit telefonní seznam, ale to jen na chvilku. Více času jste strávili hledáním vhodné aplikace na deduplikaci kontaktů na AppStoru. Zjistili jste, e v zásadě existují dva typy aplikací. Jedna na jednorázovou opravu dat a druhá, která online nabízí deduplikovaný seznam. Tu první je nutné spoutět v pravidelných intervalech. Větinou a míra anarchie přeroste únosnou hranici. Ta druhá dělá ve online za vás, leč je pomalejí a hlavně jiná. Automatika na deduplikaci zafungovala pěkně u 90 % záznamů. U zbylých 10 % záznamů byste rádi sloučení zruili nebo provedli jinak.
Stárnutí a obohacování kontaktů
Čím déle telefon a telefonní kontakty máte, tím více vás začíná trápit stárnutí dat. Některé kontakty jsou ivé, jiné méně a některé jsou ji dávno mrtvé. Bylo by fajn, aby telefonní seznam vedl statistiku o volání pro daný kontakt a indikoval stárnutí kontaktů. Zajímavou funkcí by byla i preference určitého telefonního kontaktu podle doby, kdy byla daná osoba dostupná. Firemní telefonní číslo by se automaticky volilo pro pracovní časy. Číslo na pevnou linku na vai babičku by se nevybíralo ve čtvrtek odpoledne, kdy chodí na kafíčko s kamarádkou do cukrárny.
Toté platí o automatickém obohacování kontaktů o nové atributy (LinkedIn, Google+, Skype, Slack, E-mail, WhatsApp, Otevírací doba, Adresa...). Bohuel, v současné době je to spíe hudba budoucnosti. Funkce na automatickou synchronizaci telefonního seznamu mezi přáteli a rodinnou si dokái ji nyní představit. Jde jen o rozíření slueb pro cloudové úloitě. Avak otázkou u externích slueb je bezpečnost a také to, jak je - a hlavně bude - moné s daty nakládat.
MDM v bance
Zatímco se MDM problémy běného smrtelníka dají pohodlně strčit do kapsy u kalhot, musí velké organizace řeit podobné problémy v úplně jiném rozměru. Kapsa u kalhot jim rozhodně nestačí. Místo stovek kontaktů zpracovávají desítky milionů kontaktů z desítek interních systémů. Musí se věnovat bezpečnosti jak směrem ven, tak dovnitř organizace. Směrem ven se řeí samotný přístup k datům. Směrem dovnitř zase způsob nakládání s daty. MDM problematika se často probírá na úrovni mateřské společnosti a jednotlivých dceřiných společností. Jedna data se tak nacházejí v mnoha systémech a v mnoha podobách. A pak se často stává, e takto redundantní data nejsou konzistentní buď z hlediska obsahu nebo času.
MDM v bance
Oblasti MDM
Nyní se pojďme podívat, jakých oblastí MDM jsme se dotkli a jak se dají řeit. Problematiku MDM můeme rozdělit do čtyř základních oblastí (mastering, quality, integration a data discovery). Kadá oblast se dá popsat několika způsoby uití. My se budeme vracet konkrétně k předchozímu příkladu s telefonním seznamem.
Aby bylo moné nasadit MDM řeení, je nutné nejdříve zjistit, jaká data a v jakých systémech vlastně máme k dispozici. Tomu se věnuje data discovery. Jakmile to víme, chceme data dostat na jedno společné místo, kde je můeme analyzovat. To je úkol pro datovou integraci. A nyní se začínáme zajímat o kvalitu získaných dat. Kvalitu nejdříve monitorujeme podle určitých kritérií, následně se ji snaíme buď manuálními nebo automatizovanými úpravami zvýit. Nyní máme splněny vechny předpoklady pro to, abychom se mohli věnovat masteringu dat. Mastering bez kvalitních dat na centrálním místě toti nemá anci na úspěch. Masterovaná data slouí jako referenční zdroj pro ostatní systémy. K masterovaným datům je moné přidat dalí data, tzv. metadata, která říkají, jak s těmito daty nakládat.

Oblasti MDM
Discovery
Data discovery je disciplína, která umoní více poznat data, nad kterými chceme MDM provádět. Úkolem data discovery je také určit, v jakých systémech se která data nacházejí. Dalo by se říct, e kadý svá data dobře zná. Ale opak je pravdou. Automatická data discovery je schopna určit nejen základní datové typy (string, číslo, boolean, datum, čas), ale i o úroveň vyí datové typy, jakou jsou jméno, ulice, telefon, PSČ, druhý telefon, e-mail. Pomocí datového profilingu, zaloeného na frekvenční analýze a histogramech, je moné získat různé informace o hodnotách.
Základní oblasti MDM discovery
Integration
Pro zavedení procesů MDM je nezbytné, aby byla vechna data centrálně uloena. Discovery tedy v první fázi poskytne informace o tom, v jakých systémech data jsou, a tato data se následně pomocí integrace dopraví na jedno místo pro dalí vyuití. Dochází k integraci vstupních dat z různých systémů vyuívajících různé platformy (Windows, Linux, iOS, Android), které poskytují různé technologie (webové sluby, REST API, SQL, CSV, MS Excel) v různých fragmentech (přírůstek, plný snímek). Celý proces přesunu dat je nutné řídit, protoe se data poskytují v různých intervalech a jsou na sobě závislá. Proces řízení musí být monitorován a výsledky auditovány.
Základní oblasti MDM integration
Quality
Operace masteringu předpokládají, e záznamy, se kterými pracují, mají určitou datovou kvalitu. Nekvalitní data toti mohou výsledky masteringu značně zhorit. Úroveň kvality je nutné vyhodnocovat podle pravidel, následně ji vylepovat, a to buď manuálně, nebo automatizovaně:
- Překlepy v dnení době je zcela běné identifikovat překlepy pomocí slovníků.
- Diakritika korekce diakritiky nebo velkých malých písmen patří mezi elementární problémy datové kvality.
- Čísla patně zapsané číselné kódy lze kontrolovat podle matematických vzorců.
- Datum a čas datumové a časové poloky lze vyhodnocovat a následně korigovat podle obsahu (24:15) nebo formy (23_15).
- Výčet výčtové hodnoty lze vyhodnocovat pomocí číselníků.
- Adresa komplexní datové struktury, jako je adresní bod, je moné vyhodnotit vůči externím datovým zdrojům, které představuje datový registr.
Kadé vyhodnocení kvality představuje hodnotu, která říká, jak je daný záznam kvalitní a jak je moné s tímto záznamem nakládat v následných procesech. Hodně nekvalitní záznam můe úplně změnit pohled například na výsledný mastering.
Základní oblasti MDM quality
Mastering
Mastering dat se zabývá tím, jak data z různých zdrojů (SIM karta, pamě telefonu, firemní telefonní seznam, SMS vizitky, záloha...) konsolidovat, aby ve výsledku poskytl jednotný pohled na záznamy pro okolní systémy. Konsolidace dat se týká vdy konkrétní domény (telefon, kontakt, adresa, firma...). V masteringu se vytvářejí skupiny jednotlivých záznamů, které si jsou velmi blízké. Blízkost záznamů se určuje pomocí atributů definovaných nad danou doménou. Např. pro nai doménu telefonní kontakt jde o atributy telefonní číslo, jméno, příjmení, titul, rodné číslo, příp. IČO. Jednotlivé atributy nesou informace s určitou kvalitou a podle vyhodnocení kvality jednotlivých atributů se vytváří reprezentant pro danou doménu. Pro danou skupinu ale můe existovat více reprezentantů. Nejlepí reprezentant se často označuje jako zlatý záznam neboli ideální záznam, který se pouije pro propagaci do dalích systémů nebo zpracování. Uivatel mobilního telefonu by tedy měl pracovat jen se zlatými záznamy.
Princip masteringu a zlatý záznam
U zlatých záznamů se vdy usiluje o to, aby byly jednodue vyhledatelné a editovatelné. Uivatel by měl být schopen upravit nejen definici pravidel vytváření domén, ale i definici pro tvorbu zlatého záznamu. Zlaté záznamy se dají organizovat v různých hierarchiích a sdílet s ostatními uivateli.
Základní oblasti MDM mastering
MDM v budoucnosti
Pojďme se přenést do budoucnosti. Přesněji do doby, kdy bude automatizace a poskytování slueb na denním pořádku a přitom budou programy vytvářet stále lidé. Prostě někam mezi současnost a éru Skynetu. Jak by MDM mohl probíhat?
Dodavatel k zákazníkovi fyzicky přinese MDM zařízení a poloí jej doprostřed místnosti. Místní IT povolí zařízení přistoupit do interní sítě, a to začne fungovat jako men-in-the-middle. Zařízení začne na síové vrstvě naslouchat firemnímu provozu a identifikovat dalí zařízení fyzické infrastruktury, jako jsou jednotlivé servery, tiskárny atd. Po nějaké době začne na základě protokolů určovat jednotlivé aplikace a jejich verze. Na závěr systém aplikace zjistí strukturu a obsah posílaných dat, která proudí mezi jednotlivými aplikacemi.
MDM budoucnosti
Systém automaticky vytvoří data lake a business glossary, která mohou vyuívat dalí systémy, jako je např. GDPR nebo anonymizace dat. Navíc umí např. monitorovat datovou kvalitu jednotlivých dat a dávat doporučení na její zvýení (doporučení by dával modul realizovaný umělou inteligencí). Následná konsolidace dat a mastering je pak vcelku jednoduchá úloha. Systém připraví návrhy na sloučení instancí. Následně je jen třeničkou na dortu úprava výstupního toku dle udělených souhlasů. Mezi zdroj a cíl by se vloil prvek, který automaticky upravuje jak datovou kvalitu, tak mastering, ani by bylo nutné upravovat data ve zdrojovém systému. Take odpadá nutnost upravovat primární a cílový systém. Automatická integrace na síové vrstvě umoní systém jak jednodue přidat, tak odebrat.
Takováto implementace MDM do IT ekosystému organizace by umonila nenásilnou dodávku v podobě sluby. Pokud se vám tento případ zdá jako příli daleká budoucnost, věřte, e u takto fungují IT útočníci i antivirové systémy. Obě skupiny ale vyuívají poslouchání provozu na síti jako prostředku k dosaení jiných cílů, ne k získání metadat a data exploration.
![]() |
Michal Čech Autor článku je konzultantem ve společnosti Adastra, kde působí u od roku 2003. Zpočátku se věnoval oblasti datových skladů, později se zaměřil na problémy datové integrace a datovou kvalitu, kterým se následně plně věnoval ve firmě Ataccama. Z Ataccamy se po esti letech vrátil zpět do Adastry, kde se věnuje komplexní problematice MDM. |

Formulář pro přidání akce


















