facebook
Tematické sekce
 
Branžové sekce
Přehledy
 
Tematické seriály
 

GDPR

General Data Protection Regulation zásadně mění zpracování osobních údajů a zavádí nové povinnosti...

články >>

 

Jak uřídit IT projekt a nezbláznit se

Užitečné tipy a nástroje pro řešení problémů řízení inovací a vývoje produktů...

články >>

 

Industry 4.0

Průmysl 4.0

Jaký vliv bude mít čtvrtá průmyslová revoluce na výrobu a výrobní firmy?

články >>

 

Komplexní svět eIDAS

O nařízení eIDAS již bylo mnoho řečeno i napsáno. A proto jediné, o čem...

články >>

 

Trendy v CRM

Systémy pro řízení vztahů se zákazníky (CRM) prochází v posledních letech výraznou změnou. Zatímco dříve...

články >>

 

Příručka úspěšného IT manažera

Dnes je řada IT manažerů opomíjena. Úspěšní bývají brouci Pytlíci a Ferdové...

články >>

 
Partneři webu
Compas automatizace
IT SYSTEM 6/2004

Řízení kvality dat v Českém Telecomu

V popředí zájmu jsou především data o zákaznících

Milan Kučera


Kvalita dat je nezbytnou podmínkou pro získání kvalifikovaných informací. Bez zajištění kvalitních dat na výkonné úrovni nelze očekávat správné plánování na strategické úrovni. Je v životním zájmu každé společnosti zabývat se kvalitou dat na systematické bázi. Český Telecom řeší tuto otázku za přispění metodiky a technologie dodané společností TietoEnator.







Význam řízení kvality dat
Český Telecom je poskytovatelem hlasových, datových a integrovaných služeb. Zajištění stávajících služeb a produktů stejně jako rychlý rozvoj nových s sebou nese i rychlý rozvoj informačních systémů podporujících byznys společnosti a trvale se zvyšující nároky na kvalitu a čistotu dat. V praxi běžně docházelo k tomu, že vstupní informace v rámci jednoho systému byly věcně správné, došlo-li však ke vzájemnému porovnání odpovídajících datových položek mezi několika systémy, obsahy vykazovaly rozdíly. Další zpracování takovýchto dat běžnými metodami bylo velmi komplikované. Český Telecom se proto rozhodl v rámci projektu Data Quality implementovat metodiku TIQM (Total Information Quality Management) s cílem vybudovat prostředí pro růst kvality dat a její trvalé udržení. V popředí zájmu jsou především data vztažená k zákazníkovi, například název firmy, adresa sídla firmy, poštovní adresa apod. Nárůst kvality zákaznických dat v primárních databázích odstraněním nepřesností nebo neúplností má za následek například vzestup doručitelnosti zásilek (faktur, marketingových materiálů atd.). Dále se odrazí především v kvalitě reportů, které slouží k manažerskému rozhodování. Proces zajištění kvality dat zahrnuje mimo jiné proces přípravy a zpracování dat, vyhodnocení výsledků a následná nápravná opatření.

Proces zpracování dat
Příprava a zpracování dat, měření kvality dat a zpracování výstupů ve společnosti Český Telecom jsou založeny na principech Trillium Data Quality Methodology a využívají metriky kvality dat, jako jsou správnost, přesnost, úplnost, konzistence, aktuálnost, jedinečnost či platnost. Použitý systém Trillium Software System, dodaný společností TietoEnator, je vybaven inteligentním mechanismem čištění dat založeným na fuzzy logice. Proces zpracování probíhal dle navržené metodologie v logicky na sebe navazujících krocích: analýza dat, standardizace, doplnění a sdružování dat. Analýza dat spočívá v provedení statistiky formátů datových položek, frekvenční analýzy, normalizace a transformace dat a případně validace dat proti stanoveným celopodnikovým číselníkům. Během kroku standardizace se provádí rozpoznání a roztřídění datových položek na základě znalostní báze, identifikace chyb v datech, aplikace podnikových datových standardů a příprava dat na sémantickou analýzu. Doplnění dat zahrnuje obohacení dat hodnotami ze znalostní báze a provedení komplexní sémantické analýzy. Sdružování dat spočívá v porovnání záznamů a odstranění duplicitních osob, adres nebo firem. Výsledkem procesu je vygenerování finálního doporučeného záznamu. Proces zpracování využívá znalostní bázi, ve které dodavatel řešení vytvořil aktualizovatelnou sadu pravidel pro zpracovávaná data. Základní rozsah vytvořený pro české národní prostředí, včetně celostátního registru adres v České republice, byl v průběhu zpracování dat postupně rozšířen o další pravidla, jak obecná, tak i specifická pro Český Telecom.

Nápravná opatření
Výstupy jednotlivých kroků zpracování, vypovídající o úrovni kvality dat z určitého hlediska, a jejich vyhodnocení byly podkladem pro návrhy nápravných opatření. Řešení informační kvality totiž nespočívá jen v analýze a čištění dat. Je nutné rovněž identifikovat příčiny vzniku nekvalitních informací, a ty řešit. Skutečnosti zjištěné v procesu zpracování dat proto byly konzultovány s uživateli jednotlivých systémů. Na základě těchto konzultací byly formulovány návrhy nápravných opatření, a to jak v oblasti procesní a organizační, tak v oblasti technické. Nápravná opatření zahrnovala následující oblasti:
· jednoznačnou definici obsahu sporných položek,
· návrhy na softwarové (automatizované) řešení nápravy,
· návrhy na úpravy aplikačního software,
· návrhy na změny metodik a procesů,
· ruční opravu nekonzistentních dat na základě poskytnutých sestav,
· doplnění neúplných dat ( např.chybějící IČO),
· deduplikaci dat (odstranění shodných záznamů sloučením informací do jednoho záznamu, případně
odstranění duplicitního záznamu).

Přínosy pro business
Mezi přínosy projektu Data Quality pro Český Telecom patří například:
· identifikace a oprava nesprávně zadaných telefonních čísel,
· zpřesnění zařazení zákazníků do segmentů a prodejních kanálů,
· zavedení datových standardů pro další optimalizaci řízení datové kvality,
· standardizace datových položek - Číslo účtu, Číslo banky, IČO apod.,
· oprava vazby zákazník-smlouva napříč systémy,
· identifikace zákazníků s nesprávným rodným číslem a IČO a následná oprava v systému,
· indikace a oprava chyb v datových položkách navázaných na číselníky,
· deduplikace zákazníků,
· standardizace adresních datových položek.

Trvalý proces řízení kvality dat
Řízeni kvality dat se v Českém Telecomu neomezilo jen na vlastní provedení jednorázového auditu kvality dat, ale představuje komplexní proces zajištění a udržení určité úrovně kvality dat po celou dobu jejich životního cyklu v IT prostředí společnosti. Řízení kvality dat zasahuje i do tvorby metodologie, procesů a vnitřních předpisů a standardů ve společnosti. Zajištění datové kvality a trvalá systematická péče o datovou kvalitu přináší společnosti nejen snižování nákladů, ale používání správných a validních dat, zejména ve styku se zákazníky, přispívá také k dobrému jménu celé společnosti.

Autor článku, Ing.Jaroslav Rada, působí jako account manager ve společnosti TietoEnator.

Nezbytné komponenty managementu informační kvality

Informační kvalita a kvalita dat se stávají i u nás novými a významnými termíny. Mnoho organizací se začíná zabývat projekty informační kvality, mnohdy jako součástmi projektů datového skladu (DW), analytického CRM apod. Dodavatelé software se proto snaží rychle vyvíjet a nabízet systémy pro podporu "čištění" dat. Informační kvalita se také stává nedílnou součástí aktivit mnoha konzultačních společností. Jejich reakce na potřeby zákazníků je chvályhodná, avšak ne vše, co je navrhované konzultačními společnostmi, je možné považovat za skutečné řízení informační kvality. Objevují se společnosti, hovořící o tom, že dostatečnými aktivitami je provádění analýzy dat a měření informační kvality. A to nehovoříme o zaměňování pojmů správnost a přesnost!
K základním aspektům managementu informační kvality, tak aby se stal významným nástrojem společnosti, patří:

1. Informační kvalita je obchodní problém, nikoliv IT problém
Cílem procesu informační kvality není zlepšování dat uložených v datovém skladu či jiných databázích společnosti. Cílem informační kvality je zlepšení efektivnosti obchodních a rozhodovacích procesů společnosti eliminací nákladů souvisejících s nekvalitními informacemi. Vždy se jedná o řešení zahrnující obchodní procesy, aplikace, databáze a v neposlední řadě i lidi. Řešení informační kvality bývá v některých případech uváděno jako "analýza" a/nebo "čištění" dat. To je zcela chybné. Je nutné identifikovat příčiny vzniku nekvalitních informací, a ty řešit. Existuje celá řada příčin vzniku nekvalitních dat, například nesprávně definovaný proces, neškolení producenti dat, špatný databázový design apod. Společnosti se dále domnívají, že aplikací kontrolních pravidel před vstupem dat do systému je problém nekvalitních dat vyřešen, jedná se o tzv. zero-defect prevenci. Aplikace kontrolních pravidel v rámci systému však neřeší problematiku informační kvality kompletně.

2. Zaměřte se na uživatele a dodavatelé informací, ne jenom na data
Je pravdou, že nejjednodušší zaměření informační (datové) kvality je na data samotná. Avšak toto není zcela správný přístup (byť je schopen přinést určité výsledky skoro okamžitě). Metody informační kvality musí být zaměřeny na uživatele informací. Je třeba porozumět jejich požadavkům na kvalitu informace. Také producenti informací musí cítit odpovědnost za kvalitu svých "produktů" vůči ostatním uživatelům informací. Toto je zároveň jedna z velmi důležitých vlastností souvisejících s data stewardshipem.

3. Zaměřte se na všechny komponenty informační kvality - definice, obsah, prezentace
Informační kvalita skutečně není jenom o tom, co je uloženo v databázích systémů, ale také o kvalitě ostatních formách informací (elektronická, papírová, slovní, grafická forma).

4. Vyhodnocujte přesnost, nikoliv správnost
Mnohé konzultační i dodavatelské společnosti zabývající se problematikou informační kvality nesprávně interpretují rozdíl mezi správnými a přesnými daty. V čem je rozdíl? Data uložená v databázi určitého systému vznikla jako "obraz" reálného subjektu (zákazník, produkt). Měření a vyhodnocování validity (správnosti) dat je založeno na jejich porovnání s doménovými hodnotami, případně je kontrolován jejich soulad s příslušnými obchodními pravidly. Přesnost (vzhledem k realitě) reprezentuje stupeň, s jakým data uložená v databázi organizace představují reálný subjekt.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Zahrajte si s hvězdami budoucnosti

CZECH CLASSICTurnaj Czech Classic se uskuteční 16.–21. června 2019 v GR Kaskáda jako součást Pro Golf Tour, jednoho ze čtyř oficiálních satelitů European Tour. Program kromě turnaje pro profesionály a nejlepší české amatéry zahrnuje i bohatý doprovodný program včetně tradičního turnaje partnerů s nejlepšími profesionálními hráči Pro Golf Tour, tzv. Pro-Am.

Časopis IT Systems / Odborná příloha Archiv časopisu IT Systems
IT Systems 1-2/
IT Systems 12/
IT Systems 11/
IT Systems 10/
Oborové a tematické přílohy
příloha #1 1-2/
příloha #1 11/
příloha #1 10/
příloha #1 9/
Pomáháme firmám růst
Kalendář akcí