- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (80)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
Tematické sekce
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tiskBranové sekce
![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Partneři webu
IT SYSTEM 6/2004
Čistota dat v provozních systémech
Ing. Jiří Bohuslav
Prudký rozvoj informačních technologií v posledních letech způsobil, e systémy business intelligence pro podporu rozhodování (decision support systems - DSS) ji automaticky mají své místo v podnikových systémech. Přesto se dá říci, e převáná větina rozhodovacích procesů jetě není na těchto systémech zaloena nebo informace, je tyto systémy poskytují, nejsou zcela efektivně vyuity.
Firmy často uchovávají své informace v OLTP systémech (on-line transactional processing), které zachycují detailní jednotlivé operace. OLTP systém vak není vůbec vhodný pro zodpovězení dotazů týkajících se pohledů do minulosti (Jaké byly trendy prodeje naich výrobků v minulých pěti letech?). Velmi sloitě lze z něho získat agregovaná data. OLTP systém obsahuje spoustu dat, která pro kvalitní rozhodování vůbec nepotřebujeme, a navíc není optimalizován pro sloité uivatelské dotazy. Oblast business intelligence je specifický obor, který je zaměřen převáně na poskytnutí komplexního pohledu na data koncovému uivateli a získání informací potřebných pro správné rozhodnutí. Základním krokem v procesu získání dat z provozních systémů pro kvalitní rozhodování je analýza, konsolidace a čitění zdrojových dat. Z existujících dat, např. o chování zákazníků nebo objemech prodeje v různých regionech, je třeba vytěit maximum informací, je mohou při správném vyuití poskytnout výraznou konkurenční výhodu.
Správným řeením pro získání kvalitních konsolidovaných dat je vybudování datového skladu (data warehouse), datových tri (data mart), případně OLAP aplikací (on-line analytical processing). Důleité je i zvolení vhodné technologie pro prezentaci dat uivateli (reporting), která navíc umoní intuitivním způsobem analyzovat data ve vícerozměrné struktuře a sestavovat ad-hoc dotazy. Datový sklad se tak stane velkým centralizovaným zdrojem informací pro celou firmu. Pochopitelně je v zájmu firmy, aby data v datovém skladu byla veobecně pojata jako "jedna verze pravdy". Tím se naráí na problém, e se v datovém skladu střetávají data z různých systémů v podniku, ale i různá externí data, ručně udrované evidence a podobně. Klade se zde velký důraz na zaručenou čistotu, tedy kvalitu dat. V datech přenáených do datového skladu se téměř vdy objevují duplicity, které není triviální odhalit. Tyto duplicity způsobuje proměnlivé názvosloví ("str. 56"/"stránka 56"), pouívání či nepouívání diakritiky ("Frantiek Novák"/"Frantisek Novak"), pravopisné a jiné chyby, které způsobují nekonzistenci a je nutné je rozpoznat. Větinou neexistuje korekce chyb ve zdrojovém systému, proto je třeba nekonzistence dohledat, opravit a záznamy logicky spojit do jednoho při plnění datového skladu (ETL proces). Zajímavým postřehem je, e tento proces čitění dat můe pak zpětně slouit jako opravná zpětná vazba pro zdrojový provozní informační systém. Udává se, e a 15 % vech zdrojových dat je nekonzistentních nebo nesprávných.
Kdy u je datový sklad naplněn "pravdivými" daty, je třeba dokázat data správně interpretovat, umonit uivateli provádět pohodlně a jednodue dotazy. Proto je třeba zvolit vhodný nástroj pro přístup k datům. OLAP nástroje umoňují uivatelům provádění analytických a ad-hoc dotazů. Lze je rozdělit na relační OLAP (ROLAP) a multidimenzionální OLAP (MOLAP) nástroje.
ROLAP systémy pracují přímo nad relační databází datového skladu, případně datových tri. Jejich hlavním přínosem je relativní snadnost pouití, hlavně vak okamitý přístup do zdrojové databáze, z čeho vyplývá nejvyí moná aktuálnost dat. MOLAP nástroje potřebují ke své práci multidimenzionální databázi. Multidimenzionální databáze je speciálně navrená databáze, která je plněna periodicky daty z datového skladu ve vhodné struktuře. Tato struktura je navrena tak, aby uivatel mohl snadným způsobem tvořit sestavy, přehledy a grafy, provádět analýzu dat, zjiovat historické trendy a provádět jiné převáně statistické operace. Základní vlastností multidimenzionální databáze je velmi rychlá doba odezvy, je je dána důkladnou optimalizací pro uivatelské dotazy. Multidimenzionální databáze je navíc vhodnějí pro rozpočtování a modelování dat, naopak se nehodí pro zpracování příli velkého mnoství dat. Oblast business intelligence se v poslední době stala velmi rychle se rozvíjející součástí podnikových informačních systémů poskytující poměrně hmatatelné výsledky. Integrace různých existujících a nových informačních systémů produkuje stále větí mnoství dat, ve kterých je skryto velké mnoství informací. Základním problémem zůstává, jak efektivně z těchto dat potřebné informace vytěit a jakým způsobem je posléze vyuít pro kvalitní rozhodování.
Autor článku, Ing. Jiří Bohuslav, působí jako senior consultant BI ve společnosti CCA Group a.s.

Firmy často uchovávají své informace v OLTP systémech (on-line transactional processing), které zachycují detailní jednotlivé operace. OLTP systém vak není vůbec vhodný pro zodpovězení dotazů týkajících se pohledů do minulosti (Jaké byly trendy prodeje naich výrobků v minulých pěti letech?). Velmi sloitě lze z něho získat agregovaná data. OLTP systém obsahuje spoustu dat, která pro kvalitní rozhodování vůbec nepotřebujeme, a navíc není optimalizován pro sloité uivatelské dotazy. Oblast business intelligence je specifický obor, který je zaměřen převáně na poskytnutí komplexního pohledu na data koncovému uivateli a získání informací potřebných pro správné rozhodnutí. Základním krokem v procesu získání dat z provozních systémů pro kvalitní rozhodování je analýza, konsolidace a čitění zdrojových dat. Z existujících dat, např. o chování zákazníků nebo objemech prodeje v různých regionech, je třeba vytěit maximum informací, je mohou při správném vyuití poskytnout výraznou konkurenční výhodu.
Správným řeením pro získání kvalitních konsolidovaných dat je vybudování datového skladu (data warehouse), datových tri (data mart), případně OLAP aplikací (on-line analytical processing). Důleité je i zvolení vhodné technologie pro prezentaci dat uivateli (reporting), která navíc umoní intuitivním způsobem analyzovat data ve vícerozměrné struktuře a sestavovat ad-hoc dotazy. Datový sklad se tak stane velkým centralizovaným zdrojem informací pro celou firmu. Pochopitelně je v zájmu firmy, aby data v datovém skladu byla veobecně pojata jako "jedna verze pravdy". Tím se naráí na problém, e se v datovém skladu střetávají data z různých systémů v podniku, ale i různá externí data, ručně udrované evidence a podobně. Klade se zde velký důraz na zaručenou čistotu, tedy kvalitu dat. V datech přenáených do datového skladu se téměř vdy objevují duplicity, které není triviální odhalit. Tyto duplicity způsobuje proměnlivé názvosloví ("str. 56"/"stránka 56"), pouívání či nepouívání diakritiky ("Frantiek Novák"/"Frantisek Novak"), pravopisné a jiné chyby, které způsobují nekonzistenci a je nutné je rozpoznat. Větinou neexistuje korekce chyb ve zdrojovém systému, proto je třeba nekonzistence dohledat, opravit a záznamy logicky spojit do jednoho při plnění datového skladu (ETL proces). Zajímavým postřehem je, e tento proces čitění dat můe pak zpětně slouit jako opravná zpětná vazba pro zdrojový provozní informační systém. Udává se, e a 15 % vech zdrojových dat je nekonzistentních nebo nesprávných.
Kdy u je datový sklad naplněn "pravdivými" daty, je třeba dokázat data správně interpretovat, umonit uivateli provádět pohodlně a jednodue dotazy. Proto je třeba zvolit vhodný nástroj pro přístup k datům. OLAP nástroje umoňují uivatelům provádění analytických a ad-hoc dotazů. Lze je rozdělit na relační OLAP (ROLAP) a multidimenzionální OLAP (MOLAP) nástroje.
ROLAP systémy pracují přímo nad relační databází datového skladu, případně datových tri. Jejich hlavním přínosem je relativní snadnost pouití, hlavně vak okamitý přístup do zdrojové databáze, z čeho vyplývá nejvyí moná aktuálnost dat. MOLAP nástroje potřebují ke své práci multidimenzionální databázi. Multidimenzionální databáze je speciálně navrená databáze, která je plněna periodicky daty z datového skladu ve vhodné struktuře. Tato struktura je navrena tak, aby uivatel mohl snadným způsobem tvořit sestavy, přehledy a grafy, provádět analýzu dat, zjiovat historické trendy a provádět jiné převáně statistické operace. Základní vlastností multidimenzionální databáze je velmi rychlá doba odezvy, je je dána důkladnou optimalizací pro uivatelské dotazy. Multidimenzionální databáze je navíc vhodnějí pro rozpočtování a modelování dat, naopak se nehodí pro zpracování příli velkého mnoství dat. Oblast business intelligence se v poslední době stala velmi rychle se rozvíjející součástí podnikových informačních systémů poskytující poměrně hmatatelné výsledky. Integrace různých existujících a nových informačních systémů produkuje stále větí mnoství dat, ve kterých je skryto velké mnoství informací. Základním problémem zůstává, jak efektivně z těchto dat potřebné informace vytěit a jakým způsobem je posléze vyuít pro kvalitní rozhodování.
Autor článku, Ing. Jiří Bohuslav, působí jako senior consultant BI ve společnosti CCA Group a.s.
Chcete získat časopis IT Systems s tímto a mnoha dalími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z naeho archivu.



















