- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (77)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tisk![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Datová kvalita není jen o čitění dat
Jen z intuice, dobrého nápadu a minulých úspěchů nelze ít navěky. Malé a středně velké organizace bojující s větími konkurenty u musí přidat i něco navíc získat z nasbíraných dat vyuitelné informace a znalosti, které jsou klíčové pro dosaení stanovených cílů. Bez čistých, důvěryhodných a přesných dat to vak není dlouhodobě moné.
Nekvalitní data mohou mít kodlivý vliv na zdraví podniku. Pokud nejsou včas odhalena a opravena, mohou postupně zamořit vechny propojené informační systémy, znehodnotit jejich význam a pouitelnost při rozhodování a prognózování vývoje, významně zvýit náklady a ohrozit vztahy se zákazníky a dodavateli.
Odhaduje se, e zhruba dvě třetiny programového kódu v informačních systémech jsou napsány jen proto, aby byly podchyceny anomálie v datech. Tedy dvě třetiny kódu vznikly velmi pravděpodobně dodatečně během testování a samotného provozu. Kdyby byla data předtím zkontrolována a vyčitěna, vedlo by to k velkým úsporám při vytváření a údrbě informačních systémů.
Přibývají organizace, které pouívají nástroje business intelligence na podporu rozhodování a sledování plnění stanovených cílů. Pokud tyto nástroje pouívají nekvalitní data, i výsledky pak budou nekvalitní, mnohdy i zavádějící. To můe vést k řadě problémů, někdy i existenčním. Uveďme jich pár příkladem: ztráta podílu na trhu, plýtvání materiálními i lidskými zdroji, nespokojenost zákazníků s kvalitou zboí a slueb, nesplnění plánu nákladů a výnosů, pokuty a penále, neúspěné rozvojové projekty, nízká produktivita práce a dalí. Na druhou stranu, kvalitní data pomohou zlepit rozhodovací schopnosti a zvýit úspěnost správného rozhodnutí.
Kvalita dat není statická, v čase se mění. Stačí například jen to, e se zákazník přestěhuje, změní telefonní číslo nebo číslo bankovního účtu. Ani by data někdo změnil, u se sníila jejich kvalita. Pokud jsou informace uloené ve více informačních systémech, je poměrně náročné zajistit jejich synchronizaci nebo absolutní shodu. Kvalita dat můe utrpět i ve chvíli zadání do systému. Uivatel například chybně zapsal nějaký údaj, nebo vůbec nevěděl, jak a jaká data měl zapsat.
Data profiling a dalí nástroje
Velkou větinu těchto problémů lze odstranit a předcházet jim. Pomáhají nám v tom pravidla, postupy a nástroje, které dohromady tvoří disciplínu datové kvality. Datovou kvalitu nelze vyřeit najednou, je to nekonečný proces s dílčími kroky a přínosy. Je dobré začít s jednoduími daty, jako jsou jména, kontaktní informace nebo rozličné číselníky. I drobné zlepení můe zajistit úspory a přínosy. Data jsou kvalitní tehdy, pokud o nich uivatelé řeknou, e jsou přesná a pouitelná ke svému určení. Pokud to neplatí, je nutné určit nějakou mez, kdy u je kvalita přijatelná, nebo alespoň vyjádřit jejich kvalitu procenty. Mnohdy je toti lepí udělat nějaké rozhodnutí hned na základě dat s kvalitou sedmdesát procent, ne učinit rozhodnutí o měsíc později s kvalitou devadesát pět procent. I v malé organizaci by měli být určení lidé, kteří jsou zodpovědní za data a jejich kvalitu v kadé oblasti. Neměli by to být lidé z IT, ale přímo uivatelé systémů, kteří mají k datům nejblíe, rozumí jim a ví, jestli jsou správná a úplná. Jen tito lidé mohou stanovit jejich kvalitu a podílet se na jejím zvýení.
Datová kvalita je často vnímána jako čitění dat. To je vak pouze jedna z více oblastí celé disciplíny. Nejlepích výsledků lze dosáhnout větinou tehdy, pokud organizace začne s prozkoumáním a poznáním vlastních dat. Pomocí nástrojů data profiling lze pohodlně popsat data obsaená v informačních systémech, a identifikovat tak jejich úplnost nebo nedostatky. Pomocí statistických metod lze dohledat vzájemné vztahy mezi objekty i napříč několika systémy. Výsledky z takto provedeného průzkumu dat budou pouity v dalích fázích. Data profiling popisuje ji uloená data, zatímco nástroje data monitoringu dokáou upozorňovat uivatele v reálném čase na základě stanovených pravidel. S jejich pomocí se zabrání opětovnému vzniku nedostatků. Uivatelé mohou být upozorněni, pokud byly zadány hodnoty mimo stanovený rámec, pokud nebyla splněna stanovená pravidla nebo kdy je vývoj procesu v rozporu s jeho definicí.
Doposud jsme data pouze popisovali a snaili se jim porozumět. Takto získané informace můeme pouít při jejich čitění. Několik základních čisticích operací dokáe provést i zkuený databázový uivatel. Pro sloitějí a sofistikovanějí metody je u vhodné pouít specializované nástroje. Ty mají toti vestavěné různé vzory a předdefinované operace. Na začátku je stačí nasměrovat do úloitě, kde se data určená k čitění nachází. Tyto nástroje pak zajistí operace typu: inteligentní rozpad polí, ve kterých je seskupeno více informací najednou, jako adresa, tu lze rozdělit na ulici, popisné a orientační číslo, obec, potovní směrovací číslo a zemi; celé jméno lze rozdělit na křestní jméno, druhé jméno a příjmení; více telefonních čísel v jednom poli lze rozdělit do samostatných polí atd. Kromě rozdělování polí je velmi důleité vyhledávání a odstraňování duplicit, označení nebo odstranění sirotčích záznamů, opravování poruených hierarchií nebo překryvů v platnosti záznamů. Často vyuívanou funkcionalitou je nahrazování hodnot podle speciálních masek nebo sloitějích vzorů. U nestrukturovaných textů je moné vyuít kontrolu pravopisu. Data se také často ověřují vůči interním číselníkům s materiálem, produkty, zaměstnanci, typy dokumentů nebo nastavenými procesy. Vyuívají se ovem i veřejně dostupné číselníky databáze adres, nemovitostí, automobilů nebo rejstříky fyzických a právnických osob, dluníků, internetových domén atd. V minulosti získané informace tak můeme aktualizovat nově nalezenými, nebo potvrdit, e jsou stále platné. Tím se pro uivatele stávají věrohodnějími a cennějími.
Nástroje na čitění dat jsou připraveny také na to, e uivatelé rozíří jejich standardní funkcionalitu o dalí specifické metody a pravidla, které jsou u kadé organizace rozdílné a neopakovatelné. Obsahují základní sadu příkazů, které lze vzájemně kombinovat nebo rozířit o nové, a vytvořit tak vlastní scénáře čitění. Práci usnadňuje komfortní uivatelské prostředí s intuitivními průvodci. Při výběru nástroje na čitění dat mohou hrát roli různé faktory. Je to například připojení ke stávajícím databázím, ve kterých budeme data čistit. To by mělo být výslovně podporované a jednodue nastavitelné. Tím se uetří čas i peníze na vývoj vlastní integrační vrstvy. Navíc nástroj na čitění pak umí vyuít potřebné vestavěné funkce databáze. Na druhé straně lze také napojit existující vnitropodnikové systémy na nástroj pro čitění dat například přes univerzální webovou slubu, a zpřístupnit tak jeho funkcionalitu koncovým uivatelům. Obecné doporučení při výběru nástroje říká, e je zbytečné porovnávat nástroje mezi sebou, je potřeba vyhodnotit, do jaké míry kadý nástroj splňuje nae aktuální potřeby.
Dalí oblastí v disciplíně datové kvality je obohacování dat. V této fázi se opět vyuívají externí, volně přístupné zdroje informací. Z ji zmíněných rejstříků můeme dohledat adresy, kontaktní údaje a vztahy mezi fyzickými a právnickými osobami. Tím například dokáeme rozkrýt zatím nezjitěné vazby mezi zákazníky, a eliminovat tak riziko nesplacení pohledávek. Také logistické firmy často obohacují adresy svých dodavatelů a odběratelů o geolokační informace. Dokáou tak optimalizovat náklady na přesun zboí a vyuití vlastních zdrojů. Podobných příkladů vyuití obohacených dat by se nala celá řada.
Měřitelné přínosy
Zkuenosti organizací s pouitím nástrojů a metodik datové kvality potvrzují proklamované přínosy. Ty jsou větinou velmi jednodue měřitelné, a proto se také dobře obhajují před vedením organizace. To samozřejmě umoňuje investice do dalích fází zlepování datové kvality. Co je obtíněji měřitelné, je důvěra uivatelů v kvalitní data. Lze ji vak aktivně zvyovat vzájemnou komunikací a informovaností mezi uivateli pouívajícími data a těmi, kteří jejich kvalitu zlepují.
Michal Nový




















