- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)


















![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Kvalitní data znamenají kvalitní rozhodování


Z průzkumů prováděných mezi IT manažery vyplynulo zjištění, že řada organizací provozujících sofistikované systémy „business intelligence“ pro podporu rozhodování, ponechává otázku čistoty a kvality dat jaksi stranou. Přitom i ten nejlepší analytický systém není schopen podat pravdivé informace, jestliže data, ze kterých vychází, jsou zkreslená. Dnes si i tito manažeři začínají uvědomovat důležitost kvality dat a poohlížejí se po odpovídajícím řešení. Jednou z možností je využít profesionálních nástrojů pro čištění dat. Co musí takový specializovaný systém zvládnout? V zásadě lze proces čištění dat rozdělit do několika fází:

Analýza
Proces analýzy (investigation) zkoumá charakter vstupních dat, typy a formáty jednotlivých záznamů; přičemž zpravidla odhalí informace, které byly předtím skryté z důvodu nekonzistence dat, chyb, nestandardních formátů atd. Analýza může zahrnovat:
· rozpoznání titulů, zkratek, vazeb,
· identifikace obecných údajů v záznamech (datum, telefonní číslo atd.) a instrukčních frází („odeslat“, „postoupit“ atd.),
· frekvenční analýza („Česká národní banka“ 1550 výskytů, „ČNB“ 640 výskytů, „Ceska narodni banka“ 85 výskytů),
· reportování výsledků inspekce dat.
Standardizace
Vstupní data zpravidla přicházejí z různých systémů v různých formátech, standardizace zajistí jednotnou reprezentaci informací pro další zpracování. Proces standardizace může zahrnovat:
· identifikace jednotlivých položek v záznamu,
· formátování položek do konzistentního tvaru,
· normalizace datových elementů s ohledem na jazykové a národnostní specifikace,
· konverze datových typů.
Výsledkem standardizace je potom například konzistentní záznam zákazníka v jednotném formátování, ať pochází z libovolného zdroje:
vstupní záznam | výsledek standardizace |
ABC, s. r. o. | křestní jméno: Jaroslav |
Jarosl. Jiskra, ing | příjmení: Jiskra |
Werichova 954/13 | titul: Ing. |
Praha 5-Hlubočepy | název firmy: ABC, s. r. o |
15200 | ulice: Werichova |
tel.: (02)56781234 | číslo popisné: 954 |
číslo orientační: 13 | |
obec: Praha 5 | |
část obce: Hlubočepy | |
PSČ: 152 00 | |
tel.: +420 256 781 234 |
Obohacení informací (enrichment)
V tomto procesu jsou data dokompletována, opravena a rozšířena o informace z dalších (interních či externích) zdrojů – číselníku adres, firem, obyvatelstva atd. Například v případě adresy je testováno, zda daná kombinace ulice, čísla, města a PSČ existuje, chybějící údaje jsou doplněny a chybné opraveny. V případě mezinárodních dat je použito pravidel a číselníků specifických pro příslušnou zemi u každého záznamu. Při tomto „zušlechťování“ dat jsou použity sofistikované metody a algoritmy, opírající se o dlouholeté zkušenosti v této oblasti.
Hledání souvislostí (linking)
Při precizním propojování dat jsou identifikovány vazby mezi individuálními záznamy – osoby patřící do stejné firmy, lidé žijící ve stejné domácnosti, rodinné vztahy atd. Identifikace těchto vazeb představuje nový typ informací, které mohou výrazně zefektivnit komunikaci s uvedenými subjekty. Proces propojování dat může zahrnovat:
· identifikace a seskupování údajů, reprezentujících jednu položku (zákazník, produkt, místo atd.),
· odstranění duplicit,
· identifikaci vztahů mezi subjekty,
· sdílení a/nebo agregace informací v rámci skupiny položek.
Integrace
Integrovaný přístup umožňuje organizacím implementovat jednotný proces kontroly a zušlechťování kvality dat skrze celý podnik. Tento proces reprezentuje standard pro datovou kvalitu a zajišťuje, že všechna data vstupující do kritických business systémů tomuto standardu odpovídají. Mezi klíčové vlastnosti pro celopodnikovou implementaci jednotného systému kvality dat patří:
· globální data – podpora mnohojazyčných a mnohonárodnostních dat, různá kódování,
· flexibilita – uživatelé mohou přizpůsobovat aplikaci měnícím se podmínkám a požadavkům jednoduše modifikací nadefinovaných pravidel.
Současné nástroje pro čištění dat nabízejí uživatelům vysoký komfort obsluhy. Každý z uvedených procesů lze snadno konfigurovat prostřednictvím grafického uživatelského rozhraní, pomocí kterého uživatelé definují, optimalizují a implementují pravidla, která pak řídí procesy datové kvality.
Jedním z významných zástupců nástrojů pro čištění dat, které je lokalizováno pro české potřeby a prostředí, je Trillium Software System. Tato technologie je svou výkonností a cenou určena především pro nasazení v celopodnikovém měřítku.
Čištění dat s tímto nástrojem je možné provozovat jak samostatně v dávkovém režimu, tak jako součást jiných podnikových aplikací. Pro tyto účely je k dispozici API rozhraní, pomocí něhož je možné transparentně volat jednotlivé moduly z externích aplikací. Pro rozšířené ERP/CRM systémy (SAP, Siebel) a ETL nástroje (Informatica, Oracle Warehouse Builder atd.) jsou dodávány již hotové konektory.
Čištění dat je důležité v mnoha oblastech podnikání, obzvláště tam, kde se pracuje s osobními či přesně vydefinovanými údaji. V komerční sféře má pak kvalita uvedených informací přímý vliv na kvalitu poskytovaných služeb. Největší přínos mají nástroje pro čištění dat především pro společnosti s desítkami tisíc zákazníků, jako jsou například operátoři pevných a mobilních sítí, bankovní domy, pojišťovny, poskytovatelé internetu, internetové obchody, poskytovatelé internetových služeb apod. V uvedených příkladech pak tyto nástroje přímo spolupracují s příslušnými moduly informačního systému a automaticky „čistí“ veškerá zadávaná vstupní data, ať již zasílaná z internetu či manuálně vkládaná operátorkou v call-centru. Tím je již od počátku dosaženo maximální integrity dat, na jejichž základě můžete kvalitně rozhodovat.
Autor článku, Martin Schiller, je Product managerem společnosti Sybase ČR.
![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 1 | 2 | 3 | 4 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
Formulář pro přidání akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |