- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)
Tematické sekce


















Branžové sekce
![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Partneři webu
PříLOHA #1 3/2003
O metodách, způsobech a technikách výstavby data warehouse a data warehousingu se hovoří a píše již několik let. Z původního nadstandardního nástroje určeného pro veliké a bohaté firmy se mezitím stává stále rozšířenější součást informačních systémů a ne snad běžná, ale rozhodně také již ne výjimečná komponenta IT prostředí.
Co to znamená? Znamená to, že čím dál více z nás na pozici manažerů nebo řídicích pracovníků, stejně jako profesionálů z oblasti IT je a bude konfrontováno se vším, co s data warehouse nějak souvisí, od různých technologií až po filozofii budování a způsob využití.
Nebudu zde rozebírat důvody, které svědčí pro smysluplnost vybudování datového skladu (to s díky nechám na spoluautorech této specializované přílohy), ale poradil bych těm, kteří považují data warehouse za zbytečný a pro ně samotné nepoužitelný luxus, aby se zamysleli, kolikrát, jak často a jak dlouho probíhá v jejich společnosti "sběr" - rozuměj shánění - dat, jejich násobné ověřování zda jsou úplná a správná, přepisování, opisování, přenášení, kopírování a předávání, úpravy a transformace, a to vše s výsledkem sestavení reportů, výkazů a statistik, kterým ne tak úplně všichni věří a raději se v praxi řídí svými vlastními sestavami a reporty, kterým zas tak úplně nevěří nikdo jiný.
A opravdu je často zajímavé udělat si průzkum, jaký je poměr mezi těmito vesměs neproduktivními činnostmi a tím, co by měli tito (nezřídka vysoce kvalifikovaní) lidé opravdu dělat, totiž zabývat se daty z pohledu jejich vypovídací schopnosti, analyzovat, čemu vlastně nasvědčují, posuzovat trendy a vazby, případně vydávat návrhy na opatření a doporučení nebo varovat včas před negativními či nežádoucími stavy. Stručně řečeno, kolik času zabere sběr dat a jejich zpracování do použitelné podoby a kolik času pak zbývá ne jejich solidní a hloubkovou analýzu vedoucí k podpoře řídicích pracovníků (tzv. decisionmakers) v jejich rozhodování. Velmi často je tento poměr blízký hodnotám 80:20 v neprospěch kreativní a smysluplné práce. Dobře a promyšleně vybudovaný datový sklad tento poměr může výrazně změnit nebo obrátit. Ale nejen to.
Nedávno jsme budovali data warehouse ve velké společnosti, kde značná část úsilí musela být směřována do oblasti získání kvalitních dat z několika primárních systémů. Této nezbytné aktivitě při výstavbě DW je potřeba věnovat zásadní pozornost, protože mít na jedné konzistentní platformě informace pochybné kvality není optimální výsledek. Někdy v této souvislosti mluvím o nástrojích ETL jako o ETLC tools, jejich původní funkcionalita pro extrakci, transformaci a načtení (loading) byla rozšířena o čištění (cleansing). Snahou je minimalizovat chybné a neúplné údaje nejen z hlediska jejich formátu či absence, ale i cestou kontroly logických vazeb, vyloučení extrémů a výjimek apod. V této souvislosti je ale nutno připomenout, co data warehouse nedokáže - nezlepší kvalitu dat ve vašich primárních systémech, pouze jejich nedostatky a vady může ukázat v celé šíři a komplexnosti. Nicméně při solidně zvládnutém naplňování datového skladu může dojít k něčemu podobnému, jako v této uvedené společnosti, kde se výrazným způsobem zvýšil počet uživatelů (clients) data warehouse, protože dnes i běžní uživatelé z oblasti exekutivy tvoří sestavy nebo reporty raději z tohoto zdroje než z primárního systému, který přitom často v rámci své běžné činnosti pomáhají daty naplňovat. Je to samozřejmě v neposlední řadě i otázka typu klientských nástrojů a prostředí, ve kterém se taková definice reportů nebo sestav odehrává a které často nabízí i přídavnou funkcionalitu pro výběry, třídění, selekce, konsolidace, nebo i sofistikovaný data mining.
A tím se dostávám k otázce očekávaných přínosů implementace data warehouse, ať již ve smyslu užité technologie, nebo filozofie implementační firmy, a tím také k logice vlastního přístupu k realizaci datového skladu. Datový sklad a jeho ETL (ETLC) nástroje nejsou prostředkem pro pracovníky IT, jak shromáždit nevídané objemy dat tou největší možnou rychlostí na nejmodernějším hardware, data warehouse není dalším odkladištěm dat, kam se replikují již jinde obsažené údaje bez dalších úprav, vazeb nebo zpracování, které by zvýšily jejich kvalitu a použitelnost. Stejně tak data warehouse není řešením odstraňujícím vysokou chybovost a nevěrohodnost údajů v primárních systémech. Bez solidní klientské části s potřebnou funkcionalitou, bez otevřených rozhraní a flexibilních komponent nebude data warehouse schopen uspokojit požadavky uživatelů z řad odborných útvarů. Bez robustní a škálovatelné serverové části s dostatečnými možnostmi administrace nebude akceptovatelný pro odborníky IT útvarů. Bez kvalitních ETLC nástrojů pak nebude schopen obstát z hlediska kvality ani u jedné z uvedených skupin.
Chtěl jsem tím říct, že rozhodnutí vedoucí k budování data warehouse a výběr technologie a partnerské firmy (a ona bude dlouholetým partnerem) nemůže být záležitostí jen IT specialistů nebo jen koncových uživatelů, ale ani finančního ředitele. Bez konsensu těchto profesních skupin, které přistupují k využívání a funkcionalitě datového skladu z různých hledisek, nebudou splněny předpoklady a očekávání, s nimiž byl tento krok spojován. A nemalá skupina těch, jichž se to týká, je dodnes přesvědčena, že data warehousing je něco, co v jejich případě nemá praktické využití. Ale nenechte se mýlit, pokud občas sedáte ke svému Excelu, abyste do tabulek vyplnili údaje posbírané z různých zdrojů, protože jinou možnost, jak získat potřebný report, nyní nemáte, jste na cestě k myšlence, že to přece musí jít snáze a rychleji. A pokud to stejné provádí řada vašich kolegů, podřízených nebo vedoucích, zkuste si udělat bleskový průzkum rozložení času, o kterém jsem se zmiňoval. Možná budete překvapeni, jak rychlá by mohla být návratnost vytvoření konzistentní, kompletní a perspektivní datové základny. A tou je data warehouse.
Pozn. red.: Autor článku, dr. Milan Vodička, zastává funkci General Managera společnosti MIS AG Česká republika.
Data warehouse není dalším odkladištěm dat
Milan Vodička


O metodách, způsobech a technikách výstavby data warehouse a data warehousingu se hovoří a píše již několik let. Z původního nadstandardního nástroje určeného pro veliké a bohaté firmy se mezitím stává stále rozšířenější součást informačních systémů a ne snad běžná, ale rozhodně také již ne výjimečná komponenta IT prostředí.
Co to znamená? Znamená to, že čím dál více z nás na pozici manažerů nebo řídicích pracovníků, stejně jako profesionálů z oblasti IT je a bude konfrontováno se vším, co s data warehouse nějak souvisí, od různých technologií až po filozofii budování a způsob využití.
Nebudu zde rozebírat důvody, které svědčí pro smysluplnost vybudování datového skladu (to s díky nechám na spoluautorech této specializované přílohy), ale poradil bych těm, kteří považují data warehouse za zbytečný a pro ně samotné nepoužitelný luxus, aby se zamysleli, kolikrát, jak často a jak dlouho probíhá v jejich společnosti "sběr" - rozuměj shánění - dat, jejich násobné ověřování zda jsou úplná a správná, přepisování, opisování, přenášení, kopírování a předávání, úpravy a transformace, a to vše s výsledkem sestavení reportů, výkazů a statistik, kterým ne tak úplně všichni věří a raději se v praxi řídí svými vlastními sestavami a reporty, kterým zas tak úplně nevěří nikdo jiný.
A opravdu je často zajímavé udělat si průzkum, jaký je poměr mezi těmito vesměs neproduktivními činnostmi a tím, co by měli tito (nezřídka vysoce kvalifikovaní) lidé opravdu dělat, totiž zabývat se daty z pohledu jejich vypovídací schopnosti, analyzovat, čemu vlastně nasvědčují, posuzovat trendy a vazby, případně vydávat návrhy na opatření a doporučení nebo varovat včas před negativními či nežádoucími stavy. Stručně řečeno, kolik času zabere sběr dat a jejich zpracování do použitelné podoby a kolik času pak zbývá ne jejich solidní a hloubkovou analýzu vedoucí k podpoře řídicích pracovníků (tzv. decisionmakers) v jejich rozhodování. Velmi často je tento poměr blízký hodnotám 80:20 v neprospěch kreativní a smysluplné práce. Dobře a promyšleně vybudovaný datový sklad tento poměr může výrazně změnit nebo obrátit. Ale nejen to.
Nedávno jsme budovali data warehouse ve velké společnosti, kde značná část úsilí musela být směřována do oblasti získání kvalitních dat z několika primárních systémů. Této nezbytné aktivitě při výstavbě DW je potřeba věnovat zásadní pozornost, protože mít na jedné konzistentní platformě informace pochybné kvality není optimální výsledek. Někdy v této souvislosti mluvím o nástrojích ETL jako o ETLC tools, jejich původní funkcionalita pro extrakci, transformaci a načtení (loading) byla rozšířena o čištění (cleansing). Snahou je minimalizovat chybné a neúplné údaje nejen z hlediska jejich formátu či absence, ale i cestou kontroly logických vazeb, vyloučení extrémů a výjimek apod. V této souvislosti je ale nutno připomenout, co data warehouse nedokáže - nezlepší kvalitu dat ve vašich primárních systémech, pouze jejich nedostatky a vady může ukázat v celé šíři a komplexnosti. Nicméně při solidně zvládnutém naplňování datového skladu může dojít k něčemu podobnému, jako v této uvedené společnosti, kde se výrazným způsobem zvýšil počet uživatelů (clients) data warehouse, protože dnes i běžní uživatelé z oblasti exekutivy tvoří sestavy nebo reporty raději z tohoto zdroje než z primárního systému, který přitom často v rámci své běžné činnosti pomáhají daty naplňovat. Je to samozřejmě v neposlední řadě i otázka typu klientských nástrojů a prostředí, ve kterém se taková definice reportů nebo sestav odehrává a které často nabízí i přídavnou funkcionalitu pro výběry, třídění, selekce, konsolidace, nebo i sofistikovaný data mining.
A tím se dostávám k otázce očekávaných přínosů implementace data warehouse, ať již ve smyslu užité technologie, nebo filozofie implementační firmy, a tím také k logice vlastního přístupu k realizaci datového skladu. Datový sklad a jeho ETL (ETLC) nástroje nejsou prostředkem pro pracovníky IT, jak shromáždit nevídané objemy dat tou největší možnou rychlostí na nejmodernějším hardware, data warehouse není dalším odkladištěm dat, kam se replikují již jinde obsažené údaje bez dalších úprav, vazeb nebo zpracování, které by zvýšily jejich kvalitu a použitelnost. Stejně tak data warehouse není řešením odstraňujícím vysokou chybovost a nevěrohodnost údajů v primárních systémech. Bez solidní klientské části s potřebnou funkcionalitou, bez otevřených rozhraní a flexibilních komponent nebude data warehouse schopen uspokojit požadavky uživatelů z řad odborných útvarů. Bez robustní a škálovatelné serverové části s dostatečnými možnostmi administrace nebude akceptovatelný pro odborníky IT útvarů. Bez kvalitních ETLC nástrojů pak nebude schopen obstát z hlediska kvality ani u jedné z uvedených skupin.
Chtěl jsem tím říct, že rozhodnutí vedoucí k budování data warehouse a výběr technologie a partnerské firmy (a ona bude dlouholetým partnerem) nemůže být záležitostí jen IT specialistů nebo jen koncových uživatelů, ale ani finančního ředitele. Bez konsensu těchto profesních skupin, které přistupují k využívání a funkcionalitě datového skladu z různých hledisek, nebudou splněny předpoklady a očekávání, s nimiž byl tento krok spojován. A nemalá skupina těch, jichž se to týká, je dodnes přesvědčena, že data warehousing je něco, co v jejich případě nemá praktické využití. Ale nenechte se mýlit, pokud občas sedáte ke svému Excelu, abyste do tabulek vyplnili údaje posbírané z různých zdrojů, protože jinou možnost, jak získat potřebný report, nyní nemáte, jste na cestě k myšlence, že to přece musí jít snáze a rychleji. A pokud to stejné provádí řada vašich kolegů, podřízených nebo vedoucích, zkuste si udělat bleskový průzkum rozložení času, o kterém jsem se zmiňoval. Možná budete překvapeni, jak rychlá by mohla být návratnost vytvoření konzistentní, kompletní a perspektivní datové základny. A tou je data warehouse.
Pozn. red.: Autor článku, dr. Milan Vodička, zastává funkci General Managera společnosti MIS AG Česká republika.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.
![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 1 | 2 | 3 | 4 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
IT Systems podporuje
Formulář pro přidání akce
Další vybrané akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |