facebook LinkedIN LinkedIN - follow
IT SYSTEM 6/2004

Řízení kvality dat v Českém Telecomu

V popředí zájmu jsou především data o zákaznících

Milan Kučera


Kvalita dat je nezbytnou podmínkou pro získání kvalifikovaných informací. Bez zajištění kvalitních dat na výkonné úrovni nelze očekávat správné plánování na strategické úrovni. Je v životním zájmu každé společnosti zabývat se kvalitou dat na systematické bázi. Český Telecom řeší tuto otázku za přispění metodiky a technologie dodané společností TietoEnator.







Význam řízení kvality dat
Český Telecom je poskytovatelem hlasových, datových a integrovaných služeb. Zajištění stávajících služeb a produktů stejně jako rychlý rozvoj nových s sebou nese i rychlý rozvoj informačních systémů podporujících byznys společnosti a trvale se zvyšující nároky na kvalitu a čistotu dat. V praxi běžně docházelo k tomu, že vstupní informace v rámci jednoho systému byly věcně správné, došlo-li však ke vzájemnému porovnání odpovídajících datových položek mezi několika systémy, obsahy vykazovaly rozdíly. Další zpracování takovýchto dat běžnými metodami bylo velmi komplikované. Český Telecom se proto rozhodl v rámci projektu Data Quality implementovat metodiku TIQM (Total Information Quality Management) s cílem vybudovat prostředí pro růst kvality dat a její trvalé udržení. V popředí zájmu jsou především data vztažená k zákazníkovi, například název firmy, adresa sídla firmy, poštovní adresa apod. Nárůst kvality zákaznických dat v primárních databázích odstraněním nepřesností nebo neúplností má za následek například vzestup doručitelnosti zásilek (faktur, marketingových materiálů atd.). Dále se odrazí především v kvalitě reportů, které slouží k manažerskému rozhodování. Proces zajištění kvality dat zahrnuje mimo jiné proces přípravy a zpracování dat, vyhodnocení výsledků a následná nápravná opatření.

Proces zpracování dat
Příprava a zpracování dat, měření kvality dat a zpracování výstupů ve společnosti Český Telecom jsou založeny na principech Trillium Data Quality Methodology a využívají metriky kvality dat, jako jsou správnost, přesnost, úplnost, konzistence, aktuálnost, jedinečnost či platnost. Použitý systém Trillium Software System, dodaný společností TietoEnator, je vybaven inteligentním mechanismem čištění dat založeným na fuzzy logice. Proces zpracování probíhal dle navržené metodologie v logicky na sebe navazujících krocích: analýza dat, standardizace, doplnění a sdružování dat. Analýza dat spočívá v provedení statistiky formátů datových položek, frekvenční analýzy, normalizace a transformace dat a případně validace dat proti stanoveným celopodnikovým číselníkům. Během kroku standardizace se provádí rozpoznání a roztřídění datových položek na základě znalostní báze, identifikace chyb v datech, aplikace podnikových datových standardů a příprava dat na sémantickou analýzu. Doplnění dat zahrnuje obohacení dat hodnotami ze znalostní báze a provedení komplexní sémantické analýzy. Sdružování dat spočívá v porovnání záznamů a odstranění duplicitních osob, adres nebo firem. Výsledkem procesu je vygenerování finálního doporučeného záznamu. Proces zpracování využívá znalostní bázi, ve které dodavatel řešení vytvořil aktualizovatelnou sadu pravidel pro zpracovávaná data. Základní rozsah vytvořený pro české národní prostředí, včetně celostátního registru adres v České republice, byl v průběhu zpracování dat postupně rozšířen o další pravidla, jak obecná, tak i specifická pro Český Telecom.

Nápravná opatření
Výstupy jednotlivých kroků zpracování, vypovídající o úrovni kvality dat z určitého hlediska, a jejich vyhodnocení byly podkladem pro návrhy nápravných opatření. Řešení informační kvality totiž nespočívá jen v analýze a čištění dat. Je nutné rovněž identifikovat příčiny vzniku nekvalitních informací, a ty řešit. Skutečnosti zjištěné v procesu zpracování dat proto byly konzultovány s uživateli jednotlivých systémů. Na základě těchto konzultací byly formulovány návrhy nápravných opatření, a to jak v oblasti procesní a organizační, tak v oblasti technické. Nápravná opatření zahrnovala následující oblasti:
· jednoznačnou definici obsahu sporných položek,
· návrhy na softwarové (automatizované) řešení nápravy,
· návrhy na úpravy aplikačního software,
· návrhy na změny metodik a procesů,
· ruční opravu nekonzistentních dat na základě poskytnutých sestav,
· doplnění neúplných dat ( např.chybějící IČO),
· deduplikaci dat (odstranění shodných záznamů sloučením informací do jednoho záznamu, případně
odstranění duplicitního záznamu).

Přínosy pro business
Mezi přínosy projektu Data Quality pro Český Telecom patří například:
· identifikace a oprava nesprávně zadaných telefonních čísel,
· zpřesnění zařazení zákazníků do segmentů a prodejních kanálů,
· zavedení datových standardů pro další optimalizaci řízení datové kvality,
· standardizace datových položek - Číslo účtu, Číslo banky, IČO apod.,
· oprava vazby zákazník-smlouva napříč systémy,
· identifikace zákazníků s nesprávným rodným číslem a IČO a následná oprava v systému,
· indikace a oprava chyb v datových položkách navázaných na číselníky,
· deduplikace zákazníků,
· standardizace adresních datových položek.

Trvalý proces řízení kvality dat
Řízeni kvality dat se v Českém Telecomu neomezilo jen na vlastní provedení jednorázového auditu kvality dat, ale představuje komplexní proces zajištění a udržení určité úrovně kvality dat po celou dobu jejich životního cyklu v IT prostředí společnosti. Řízení kvality dat zasahuje i do tvorby metodologie, procesů a vnitřních předpisů a standardů ve společnosti. Zajištění datové kvality a trvalá systematická péče o datovou kvalitu přináší společnosti nejen snižování nákladů, ale používání správných a validních dat, zejména ve styku se zákazníky, přispívá také k dobrému jménu celé společnosti.

Autor článku, Ing.Jaroslav Rada, působí jako account manager ve společnosti TietoEnator.

Nezbytné komponenty managementu informační kvality

Informační kvalita a kvalita dat se stávají i u nás novými a významnými termíny. Mnoho organizací se začíná zabývat projekty informační kvality, mnohdy jako součástmi projektů datového skladu (DW), analytického CRM apod. Dodavatelé software se proto snaží rychle vyvíjet a nabízet systémy pro podporu "čištění" dat. Informační kvalita se také stává nedílnou součástí aktivit mnoha konzultačních společností. Jejich reakce na potřeby zákazníků je chvályhodná, avšak ne vše, co je navrhované konzultačními společnostmi, je možné považovat za skutečné řízení informační kvality. Objevují se společnosti, hovořící o tom, že dostatečnými aktivitami je provádění analýzy dat a měření informační kvality. A to nehovoříme o zaměňování pojmů správnost a přesnost!
K základním aspektům managementu informační kvality, tak aby se stal významným nástrojem společnosti, patří:

1. Informační kvalita je obchodní problém, nikoliv IT problém
Cílem procesu informační kvality není zlepšování dat uložených v datovém skladu či jiných databázích společnosti. Cílem informační kvality je zlepšení efektivnosti obchodních a rozhodovacích procesů společnosti eliminací nákladů souvisejících s nekvalitními informacemi. Vždy se jedná o řešení zahrnující obchodní procesy, aplikace, databáze a v neposlední řadě i lidi. Řešení informační kvality bývá v některých případech uváděno jako "analýza" a/nebo "čištění" dat. To je zcela chybné. Je nutné identifikovat příčiny vzniku nekvalitních informací, a ty řešit. Existuje celá řada příčin vzniku nekvalitních dat, například nesprávně definovaný proces, neškolení producenti dat, špatný databázový design apod. Společnosti se dále domnívají, že aplikací kontrolních pravidel před vstupem dat do systému je problém nekvalitních dat vyřešen, jedná se o tzv. zero-defect prevenci. Aplikace kontrolních pravidel v rámci systému však neřeší problematiku informační kvality kompletně.

2. Zaměřte se na uživatele a dodavatelé informací, ne jenom na data
Je pravdou, že nejjednodušší zaměření informační (datové) kvality je na data samotná. Avšak toto není zcela správný přístup (byť je schopen přinést určité výsledky skoro okamžitě). Metody informační kvality musí být zaměřeny na uživatele informací. Je třeba porozumět jejich požadavkům na kvalitu informace. Také producenti informací musí cítit odpovědnost za kvalitu svých "produktů" vůči ostatním uživatelům informací. Toto je zároveň jedna z velmi důležitých vlastností souvisejících s data stewardshipem.

3. Zaměřte se na všechny komponenty informační kvality - definice, obsah, prezentace
Informační kvalita skutečně není jenom o tom, co je uloženo v databázích systémů, ale také o kvalitě ostatních formách informací (elektronická, papírová, slovní, grafická forma).

4. Vyhodnocujte přesnost, nikoliv správnost
Mnohé konzultační i dodavatelské společnosti zabývající se problematikou informační kvality nesprávně interpretují rozdíl mezi správnými a přesnými daty. V čem je rozdíl? Data uložená v databázi určitého systému vznikla jako "obraz" reálného subjektu (zákazník, produkt). Měření a vyhodnocování validity (správnosti) dat je založeno na jejich porovnání s doménovými hodnotami, případně je kontrolován jejich soulad s příslušnými obchodními pravidly. Přesnost (vzhledem k realitě) reprezentuje stupeň, s jakým data uložená v databázi organizace představují reálný subjekt.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Signys Logistics: Řízení skladů přes mobilní aplikaci efektivně a online!

Moderní logistika vyžaduje efektivní a spolehlivé řešení pro řízení skladů a sledování zásob. S aplikací Signys Logistics a modu­lem řízených skladů WMS Signys máte na dosah ruky nástroje, které vám umožní zvýšit efektivitu vašich logistických operací a dosáhnout tak co nejvíce optimálního využití zdrojů.