- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)
Tematické sekce


















Branžové sekce
![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Partneři webu
IT SYSTEM 6/2004
Čistota dat v provozních systémech
Ing. Jiří Bohuslav
Prudký rozvoj informačních technologií v posledních letech způsobil, že systémy business intelligence pro podporu rozhodování (decision support systems - DSS) již automaticky mají své místo v podnikových systémech. Přesto se dá říci, že převážná většina rozhodovacích procesů ještě není na těchto systémech založena nebo informace, jež tyto systémy poskytují, nejsou zcela efektivně využity.
Firmy často uchovávají své informace v OLTP systémech (on-line transactional processing), které zachycují detailní jednotlivé operace. OLTP systém však není vůbec vhodný pro zodpovězení dotazů týkajících se pohledů do minulosti (Jaké byly trendy prodeje našich výrobků v minulých pěti letech?). Velmi složitě lze z něho získat agregovaná data. OLTP systém obsahuje spoustu dat, která pro kvalitní rozhodování vůbec nepotřebujeme, a navíc není optimalizován pro složité uživatelské dotazy. Oblast business intelligence je specifický obor, který je zaměřen převážně na poskytnutí komplexního pohledu na data koncovému uživateli a získání informací potřebných pro správné rozhodnutí. Základním krokem v procesu získání dat z provozních systémů pro kvalitní rozhodování je analýza, konsolidace a čištění zdrojových dat. Z existujících dat, např. o chování zákazníků nebo objemech prodeje v různých regionech, je třeba vytěžit maximum informací, jež mohou při správném využití poskytnout výraznou konkurenční výhodu.
Správným řešením pro získání kvalitních konsolidovaných dat je vybudování datového skladu (data warehouse), datových tržišť (data mart), případně OLAP aplikací (on-line analytical processing). Důležité je i zvolení vhodné technologie pro prezentaci dat uživateli (reporting), která navíc umožní intuitivním způsobem analyzovat data ve vícerozměrné struktuře a sestavovat ad-hoc dotazy. Datový sklad se tak stane velkým centralizovaným zdrojem informací pro celou firmu. Pochopitelně je v zájmu firmy, aby data v datovém skladu byla všeobecně pojata jako "jedna verze pravdy". Tím se naráží na problém, že se v datovém skladu střetávají data z různých systémů v podniku, ale i různá externí data, ručně udržované evidence a podobně. Klade se zde velký důraz na zaručenou čistotu, tedy kvalitu dat. V datech přenášených do datového skladu se téměř vždy objevují duplicity, které není triviální odhalit. Tyto duplicity způsobuje proměnlivé názvosloví ("str. 56"/"stránka 56"), používání či nepoužívání diakritiky ("František Novák"/"Frantisek Novak"), pravopisné a jiné chyby, které způsobují nekonzistenci a je nutné je rozpoznat. Většinou neexistuje korekce chyb ve zdrojovém systému, proto je třeba nekonzistence dohledat, opravit a záznamy logicky spojit do jednoho při plnění datového skladu (ETL proces). Zajímavým postřehem je, že tento proces čištění dat může pak zpětně sloužit jako opravná zpětná vazba pro zdrojový provozní informační systém. Udává se, že až 15 % všech zdrojových dat je nekonzistentních nebo nesprávných.
Když už je datový sklad naplněn "pravdivými" daty, je třeba dokázat data správně interpretovat, umožnit uživateli provádět pohodlně a jednoduše dotazy. Proto je třeba zvolit vhodný nástroj pro přístup k datům. OLAP nástroje umožňují uživatelům provádění analytických a ad-hoc dotazů. Lze je rozdělit na relační OLAP (ROLAP) a multidimenzionální OLAP (MOLAP) nástroje.
ROLAP systémy pracují přímo nad relační databází datového skladu, případně datových tržišť. Jejich hlavním přínosem je relativní snadnost použití, hlavně však okamžitý přístup do zdrojové databáze, z čehož vyplývá nejvyšší možná aktuálnost dat. MOLAP nástroje potřebují ke své práci multidimenzionální databázi. Multidimenzionální databáze je speciálně navržená databáze, která je plněna periodicky daty z datového skladu ve vhodné struktuře. Tato struktura je navržena tak, aby uživatel mohl snadným způsobem tvořit sestavy, přehledy a grafy, provádět analýzu dat, zjišťovat historické trendy a provádět jiné převážně statistické operace. Základní vlastností multidimenzionální databáze je velmi rychlá doba odezvy, jež je dána důkladnou optimalizací pro uživatelské dotazy. Multidimenzionální databáze je navíc vhodnější pro rozpočtování a modelování dat, naopak se nehodí pro zpracování příliš velkého množství dat. Oblast business intelligence se v poslední době stala velmi rychle se rozvíjející součástí podnikových informačních systémů poskytující poměrně hmatatelné výsledky. Integrace různých existujících a nových informačních systémů produkuje stále větší množství dat, ve kterých je skryto velké množství informací. Základním problémem zůstává, jak efektivně z těchto dat potřebné informace vytěžit a jakým způsobem je posléze využít pro kvalitní rozhodování.
Autor článku, Ing. Jiří Bohuslav, působí jako senior consultant BI ve společnosti CCA Group a.s.



Firmy často uchovávají své informace v OLTP systémech (on-line transactional processing), které zachycují detailní jednotlivé operace. OLTP systém však není vůbec vhodný pro zodpovězení dotazů týkajících se pohledů do minulosti (Jaké byly trendy prodeje našich výrobků v minulých pěti letech?). Velmi složitě lze z něho získat agregovaná data. OLTP systém obsahuje spoustu dat, která pro kvalitní rozhodování vůbec nepotřebujeme, a navíc není optimalizován pro složité uživatelské dotazy. Oblast business intelligence je specifický obor, který je zaměřen převážně na poskytnutí komplexního pohledu na data koncovému uživateli a získání informací potřebných pro správné rozhodnutí. Základním krokem v procesu získání dat z provozních systémů pro kvalitní rozhodování je analýza, konsolidace a čištění zdrojových dat. Z existujících dat, např. o chování zákazníků nebo objemech prodeje v různých regionech, je třeba vytěžit maximum informací, jež mohou při správném využití poskytnout výraznou konkurenční výhodu.
Správným řešením pro získání kvalitních konsolidovaných dat je vybudování datového skladu (data warehouse), datových tržišť (data mart), případně OLAP aplikací (on-line analytical processing). Důležité je i zvolení vhodné technologie pro prezentaci dat uživateli (reporting), která navíc umožní intuitivním způsobem analyzovat data ve vícerozměrné struktuře a sestavovat ad-hoc dotazy. Datový sklad se tak stane velkým centralizovaným zdrojem informací pro celou firmu. Pochopitelně je v zájmu firmy, aby data v datovém skladu byla všeobecně pojata jako "jedna verze pravdy". Tím se naráží na problém, že se v datovém skladu střetávají data z různých systémů v podniku, ale i různá externí data, ručně udržované evidence a podobně. Klade se zde velký důraz na zaručenou čistotu, tedy kvalitu dat. V datech přenášených do datového skladu se téměř vždy objevují duplicity, které není triviální odhalit. Tyto duplicity způsobuje proměnlivé názvosloví ("str. 56"/"stránka 56"), používání či nepoužívání diakritiky ("František Novák"/"Frantisek Novak"), pravopisné a jiné chyby, které způsobují nekonzistenci a je nutné je rozpoznat. Většinou neexistuje korekce chyb ve zdrojovém systému, proto je třeba nekonzistence dohledat, opravit a záznamy logicky spojit do jednoho při plnění datového skladu (ETL proces). Zajímavým postřehem je, že tento proces čištění dat může pak zpětně sloužit jako opravná zpětná vazba pro zdrojový provozní informační systém. Udává se, že až 15 % všech zdrojových dat je nekonzistentních nebo nesprávných.
Když už je datový sklad naplněn "pravdivými" daty, je třeba dokázat data správně interpretovat, umožnit uživateli provádět pohodlně a jednoduše dotazy. Proto je třeba zvolit vhodný nástroj pro přístup k datům. OLAP nástroje umožňují uživatelům provádění analytických a ad-hoc dotazů. Lze je rozdělit na relační OLAP (ROLAP) a multidimenzionální OLAP (MOLAP) nástroje.
ROLAP systémy pracují přímo nad relační databází datového skladu, případně datových tržišť. Jejich hlavním přínosem je relativní snadnost použití, hlavně však okamžitý přístup do zdrojové databáze, z čehož vyplývá nejvyšší možná aktuálnost dat. MOLAP nástroje potřebují ke své práci multidimenzionální databázi. Multidimenzionální databáze je speciálně navržená databáze, která je plněna periodicky daty z datového skladu ve vhodné struktuře. Tato struktura je navržena tak, aby uživatel mohl snadným způsobem tvořit sestavy, přehledy a grafy, provádět analýzu dat, zjišťovat historické trendy a provádět jiné převážně statistické operace. Základní vlastností multidimenzionální databáze je velmi rychlá doba odezvy, jež je dána důkladnou optimalizací pro uživatelské dotazy. Multidimenzionální databáze je navíc vhodnější pro rozpočtování a modelování dat, naopak se nehodí pro zpracování příliš velkého množství dat. Oblast business intelligence se v poslední době stala velmi rychle se rozvíjející součástí podnikových informačních systémů poskytující poměrně hmatatelné výsledky. Integrace různých existujících a nových informačních systémů produkuje stále větší množství dat, ve kterých je skryto velké množství informací. Základním problémem zůstává, jak efektivně z těchto dat potřebné informace vytěžit a jakým způsobem je posléze využít pro kvalitní rozhodování.
Autor článku, Ing. Jiří Bohuslav, působí jako senior consultant BI ve společnosti CCA Group a.s.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.
![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 1 | 2 | 3 | 4 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
IT Systems podporuje
Formulář pro přidání akce
Další vybrané akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |