- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)
Tematické sekce


















Branžové sekce
![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Partneři webu
IT SYSTEM 11/2000
Dolování dat:
Vizualizace dat jako klíčový prvek data warehousingu
Petr Provazník [ petrp (zavináč) sgi (tečka) cz ]
Data Mining a Data Warehousing jsou v současnosti aktuálním tématem nejen pro počítačové odborníky. Disky pojmou stále více dat, a proto neustále vzrůstá i objem ukládaných dat, ať už užitečných nebo zbytečných.
Skrytý potenciál dat
Vzrůstá i objem obchodních a průmyslových databází. S digitalizací telefonní sítě postupuje monitoring telefonních hovorů a jejich atributů všeho druhu (čas, délka, místní nebo meziměsto,...). Na vlastní peněžence se přesvědčujeme o dopadu analýzy těchto informací. Před několika lety končila doba silného provozu ve čtyři hodiny odpoledne, donedávna platila jako hranice šestá hodina a teď nastal posun na sedmou. Zlevňují se meziměstské a mezistátní hovory. Tato politika má původ v dlouhodobějším sledování hovorů a v reakci na ně.
Řetězce obchodů se spotřebním zbožím si tvoří databáze svých zákazníků, ze kterých lze vyčíst velké množství zajímavých marketingových informací, protože jsou k dispozici data o každém nákupu, o každé položce, času nákupu, věku zákazníka, atd.
O velikosti databází při bankovních transakcích, zvláště při zavádění kreditních karet a elektronických peněženek se není třeba zmiňovat. Každému je jasné, že jde (a hlavně půjde) o obrovské objemy dat. Úsměv vyvolala nedávno uveřejněná snaha nejmenované politické strany o evidenci pohybu všech bankovních transakcí v republice. Každého, kdo se pohybuje chvíli v praxi, jistě hned napadne, že hodně dlouho potrvá, než se jen sjednotí formát předávaných dat, nemluvě o napsání filtrů, jejich zavedení,... A to je jen začátek.
Toto je jen několik příkladů z praxe, kde evidentně narůstá objem uložených dat. Bohaté zdroje informací pro rozhodující pracovníky si však většinou leží tiše a v klidu nevyužity, schovány pod lavinou jiných dat. O kolik efektivněji lze řídit firmu, známe-li nákupní zvyklosti našich zákazníků, co nakupují jaké věkové kategorie, kam nejčastěji telefonují teenageři, jak velké platby se provádějí v tom daném období dne...
Pokud shrneme předchozí úvahy, vychází nám, že máme nebo budeme mít k dispozici z hlediska výpočetní techniky velké ukládací prostory a z hlediska uživatelů poroste zájem o využívání velkých objemů ukládaných dat. Nyní je zřejmé, že chybí prostřední článek, který by to všechno realizoval.
Data mining
Data mining neboli dolování dat je právě oním spojovacím elementem, který by měl umožnit uživatelům praktické využití jejich obrovského množství dat. Účelem dolování dat je objevit a zobrazit jisté "vzory" (patterns) v datech, které mohou být použity na řešení problému. V tomto ohledu lze mnohé zautomatizovat a ukázat jen výsledky počítačové analýzy rozsáhlého množství dat, něco jako "důležitou špičku ledovce". Analytická těžba dat ve spojení s výkonnými vizualizačními metodami vede zpravidla k jiným pohledům managementu na daný podnikový problém. Příkladem mohou být objevené nové korelace mezi atributy ("nejvíce čokolády kupují tatínkové ve věku 25-35 let ve večerních hodinách"), předpovídání budoucnosti z dat nasbíraných v minulosti (na budoucí zimní olympijské hry přijde o 15% více diváků než na minulé hry v Naganu), binární operace na diferencovaných množinách dat (v pondělí ráno budou telefonovat maminky aby si sdělily, jak se měly o víkendu a zároveň se budou vyřizovat počáteční pracovní rozhovory týdne, takže lze mezi 9-12 hodinou očekávat špičku v telefonní síti).
V běžných dotazech na databáze nebo v přímém analytickém procesu (Online Analytical Processing - OLAP) musí uživatel specifikovat jakýkoliv vztah mezi datovými elementy. Těžbou dat lze objevit vztahy, které uživatel nemusí vidět a dokonce ani tušit.
Pokud uživatel o vztahu neví, nelze správně zformulovat dotaz a tudíž není ani žádná odpověď. Pro příklad nemusíme jít daleko - zkuste najít na Internetu, pokud znáte jen dvě klíčová slova, tu svoji informaci mezi statisíci stránkami.
Vizualizace
Datové sklady a nástroj pro jejich využívání existují na různých úrovních. Těžbu dat lze provádět od jednoduchého dotazu do databáze přes tvorbu tabulky z uložených dat až po vizuální zobrazení analýz z dat pocházejících z několika databází. První stupeň - jednoduché dotazy, krátké výpisy, malé tabulky nebo nepříliš složité analýzy zvládne každý trochu fundovanější člověk téměř "on-line", ihned. O stupeň výše je "typicky počítačové" zobrazení ve formě např. tabulky nebo 3D grafu spolu s jednoduchou analýzou. Nejvyšší stupeň představuje 2D nebo 3D vizualizace uložených dat.
Vizualizace vznikla proto, že grafická podoba dat je pro člověka intuitivní, více přijatelná, rychleji se chápe a lépe se pamatuje.
Lidské smysly mnohem dříve odhalí anomálie a podobnosti v datech, které jsou zobrazeny v grafické podobě než když data dostaneme před sebe ve formě tabulky. Tváře lidí si pamatujeme obecně mnohem lehčeji než jména.
Vizualizace neznamená "hezčí" zobrazení téhož, co je napsáno v tabulce. Obecně se jedná o problém promítnutí vícerozměrných prostorů do třírozměrného prostoru spolu s výpočetně náročnou analýzou dat, která poskytne pohled z jiného úhlu. V 3D je člověk schopen přirozeně efektivně analyzovat i velmi složité vztahy. Pro usnadnění analýzy trendů bývá třírozměrný prostor rozšířen o čtvrtý rozměr formou možnosti animace objektů v čase.
Vizualizační metody proto používají lidé, kteří se potřebují rychle a kvalitně rozhodovat. Zde stačí uživatelsky ovládat vyspělou výpočetní techniku a pomocí kvalitních vizualizačních programů pro těžbu dat se lze dobrat velmi zajímavých a obchodně efektivních výsledků.
Rysy moderních programů pro těžbu dat
Moderní programy obsahují paralelně pracující algoritmy pro těžbu dat, které znatelně zrychlují výpočetně náročný proces. Další součástí bývají analytické nástroje, jako je regrese, clustering (rozdělení dat do podobných skupin, jako např. segmenty identifikace zákazníka pro cílený marketing; rychlé pochopení jednotlivých segmentů pak zprostředkovává vizualizační nástroj) a rozhodovací tabulky pro intuitivní rozbor dat. Moderním prvkem je tzv. boosting, což je zvyšování přesnosti modelu opakovanou adjustací kvůli kompenzaci chyb.
Užitečnou funkcí je podpora předpovídání spojitých (nediskrétních) atributů, jako je zisk, obrat nebo podíl na trhu, což umožňuje stanovit další obchodní a marketingovou strategii.
Velmi vyhledávaným prvkem jsou křivky návratnosti vložených investic (ROI - Return-On-Investments). Znázorňují náklady spojené s doporučenou činností a jsou dnes při rozhodování velmi důležitou informací.
Začleněná korekce chyb zrychluje a zpřesňuje průběh závažných obchodních rozhodování. V kvalitních nástrojích bývají zabudovány i rozhodovací tabulky pro zákazníky s technickým i obchodním zaměřením, které umožňují kvalifikovaně řídit operace OLAP (On-Line Analytical Processing) za použití vizuálního prostředí pro zobrazení kritických faktorů a jejich vzájemnou souvislost.
Dalšími zajímavými prvky zjednodušujícími rozhodování jsou:
· "létání" přes 3D objekty
· zvětšování a zmenšování datových objektů
· grafické vytváření dotazů do databází
· vizuální třídění dat
· přehrávání a opakování animací
· trendové analýzy pomocí animace až přes dvě nezávislé proměnné
· vizuální filtrování dat a informací
· možnost pohledů od globálních po detaily
· vlastní řízení úhlu pohledu na data a zobrazení
Hardwarové nároky
Pro účely dolování dat je nezbytné nasadit počítače s vysokou propustností a stupňovatelností výkonu (s rostoucím objemem dat). Důležitým rysem je i případný paralelismus při zpracování dat pro urychlení výpočtů. Ke splnění požadavku vizualizace je nutný dobrý grafický hardware. Celkově je tedy nutno pro účely vizuálního zpracování velkého množství dat použít výkonný hardware se stabilním operačním systémem a pokud možno se zaručenou průchodností systému.
Závěrem
Důsledné a účelné využití techniky dolování dat pro management firmy dává zcela zřejmou výhodu firmám, které jsou (nebo předvídají, že budou) pod velkým konkurenčním tlakem. Těžba dat již dnes nachází své místo na průmyslových trzích, v obchodě, v telekomunikacích i ve vládním a finančním sektoru, kde je silným nástrojem pro podporu rozhodovacích procesů. Bude zajímavé sledovat vývoj v této oblasti a jeho praktické uplatnění v našich podmínkách.
Silicon Graphics s.r.o.


Skrytý potenciál dat
Vzrůstá i objem obchodních a průmyslových databází. S digitalizací telefonní sítě postupuje monitoring telefonních hovorů a jejich atributů všeho druhu (čas, délka, místní nebo meziměsto,...). Na vlastní peněžence se přesvědčujeme o dopadu analýzy těchto informací. Před několika lety končila doba silného provozu ve čtyři hodiny odpoledne, donedávna platila jako hranice šestá hodina a teď nastal posun na sedmou. Zlevňují se meziměstské a mezistátní hovory. Tato politika má původ v dlouhodobějším sledování hovorů a v reakci na ně.
Řetězce obchodů se spotřebním zbožím si tvoří databáze svých zákazníků, ze kterých lze vyčíst velké množství zajímavých marketingových informací, protože jsou k dispozici data o každém nákupu, o každé položce, času nákupu, věku zákazníka, atd.
O velikosti databází při bankovních transakcích, zvláště při zavádění kreditních karet a elektronických peněženek se není třeba zmiňovat. Každému je jasné, že jde (a hlavně půjde) o obrovské objemy dat. Úsměv vyvolala nedávno uveřejněná snaha nejmenované politické strany o evidenci pohybu všech bankovních transakcí v republice. Každého, kdo se pohybuje chvíli v praxi, jistě hned napadne, že hodně dlouho potrvá, než se jen sjednotí formát předávaných dat, nemluvě o napsání filtrů, jejich zavedení,... A to je jen začátek.
Toto je jen několik příkladů z praxe, kde evidentně narůstá objem uložených dat. Bohaté zdroje informací pro rozhodující pracovníky si však většinou leží tiše a v klidu nevyužity, schovány pod lavinou jiných dat. O kolik efektivněji lze řídit firmu, známe-li nákupní zvyklosti našich zákazníků, co nakupují jaké věkové kategorie, kam nejčastěji telefonují teenageři, jak velké platby se provádějí v tom daném období dne...
Pokud shrneme předchozí úvahy, vychází nám, že máme nebo budeme mít k dispozici z hlediska výpočetní techniky velké ukládací prostory a z hlediska uživatelů poroste zájem o využívání velkých objemů ukládaných dat. Nyní je zřejmé, že chybí prostřední článek, který by to všechno realizoval.
Data mining
Data mining neboli dolování dat je právě oním spojovacím elementem, který by měl umožnit uživatelům praktické využití jejich obrovského množství dat. Účelem dolování dat je objevit a zobrazit jisté "vzory" (patterns) v datech, které mohou být použity na řešení problému. V tomto ohledu lze mnohé zautomatizovat a ukázat jen výsledky počítačové analýzy rozsáhlého množství dat, něco jako "důležitou špičku ledovce". Analytická těžba dat ve spojení s výkonnými vizualizačními metodami vede zpravidla k jiným pohledům managementu na daný podnikový problém. Příkladem mohou být objevené nové korelace mezi atributy ("nejvíce čokolády kupují tatínkové ve věku 25-35 let ve večerních hodinách"), předpovídání budoucnosti z dat nasbíraných v minulosti (na budoucí zimní olympijské hry přijde o 15% více diváků než na minulé hry v Naganu), binární operace na diferencovaných množinách dat (v pondělí ráno budou telefonovat maminky aby si sdělily, jak se měly o víkendu a zároveň se budou vyřizovat počáteční pracovní rozhovory týdne, takže lze mezi 9-12 hodinou očekávat špičku v telefonní síti).
V běžných dotazech na databáze nebo v přímém analytickém procesu (Online Analytical Processing - OLAP) musí uživatel specifikovat jakýkoliv vztah mezi datovými elementy. Těžbou dat lze objevit vztahy, které uživatel nemusí vidět a dokonce ani tušit.
Pokud uživatel o vztahu neví, nelze správně zformulovat dotaz a tudíž není ani žádná odpověď. Pro příklad nemusíme jít daleko - zkuste najít na Internetu, pokud znáte jen dvě klíčová slova, tu svoji informaci mezi statisíci stránkami.
Vizualizace
Datové sklady a nástroj pro jejich využívání existují na různých úrovních. Těžbu dat lze provádět od jednoduchého dotazu do databáze přes tvorbu tabulky z uložených dat až po vizuální zobrazení analýz z dat pocházejících z několika databází. První stupeň - jednoduché dotazy, krátké výpisy, malé tabulky nebo nepříliš složité analýzy zvládne každý trochu fundovanější člověk téměř "on-line", ihned. O stupeň výše je "typicky počítačové" zobrazení ve formě např. tabulky nebo 3D grafu spolu s jednoduchou analýzou. Nejvyšší stupeň představuje 2D nebo 3D vizualizace uložených dat.
Vizualizace vznikla proto, že grafická podoba dat je pro člověka intuitivní, více přijatelná, rychleji se chápe a lépe se pamatuje.
Lidské smysly mnohem dříve odhalí anomálie a podobnosti v datech, které jsou zobrazeny v grafické podobě než když data dostaneme před sebe ve formě tabulky. Tváře lidí si pamatujeme obecně mnohem lehčeji než jména.
Vizualizace neznamená "hezčí" zobrazení téhož, co je napsáno v tabulce. Obecně se jedná o problém promítnutí vícerozměrných prostorů do třírozměrného prostoru spolu s výpočetně náročnou analýzou dat, která poskytne pohled z jiného úhlu. V 3D je člověk schopen přirozeně efektivně analyzovat i velmi složité vztahy. Pro usnadnění analýzy trendů bývá třírozměrný prostor rozšířen o čtvrtý rozměr formou možnosti animace objektů v čase.
Vizualizační metody proto používají lidé, kteří se potřebují rychle a kvalitně rozhodovat. Zde stačí uživatelsky ovládat vyspělou výpočetní techniku a pomocí kvalitních vizualizačních programů pro těžbu dat se lze dobrat velmi zajímavých a obchodně efektivních výsledků.
Rysy moderních programů pro těžbu dat
Moderní programy obsahují paralelně pracující algoritmy pro těžbu dat, které znatelně zrychlují výpočetně náročný proces. Další součástí bývají analytické nástroje, jako je regrese, clustering (rozdělení dat do podobných skupin, jako např. segmenty identifikace zákazníka pro cílený marketing; rychlé pochopení jednotlivých segmentů pak zprostředkovává vizualizační nástroj) a rozhodovací tabulky pro intuitivní rozbor dat. Moderním prvkem je tzv. boosting, což je zvyšování přesnosti modelu opakovanou adjustací kvůli kompenzaci chyb.
Užitečnou funkcí je podpora předpovídání spojitých (nediskrétních) atributů, jako je zisk, obrat nebo podíl na trhu, což umožňuje stanovit další obchodní a marketingovou strategii.
Velmi vyhledávaným prvkem jsou křivky návratnosti vložených investic (ROI - Return-On-Investments). Znázorňují náklady spojené s doporučenou činností a jsou dnes při rozhodování velmi důležitou informací.
Začleněná korekce chyb zrychluje a zpřesňuje průběh závažných obchodních rozhodování. V kvalitních nástrojích bývají zabudovány i rozhodovací tabulky pro zákazníky s technickým i obchodním zaměřením, které umožňují kvalifikovaně řídit operace OLAP (On-Line Analytical Processing) za použití vizuálního prostředí pro zobrazení kritických faktorů a jejich vzájemnou souvislost.
Dalšími zajímavými prvky zjednodušujícími rozhodování jsou:
· "létání" přes 3D objekty
· zvětšování a zmenšování datových objektů
· grafické vytváření dotazů do databází
· vizuální třídění dat
· přehrávání a opakování animací
· trendové analýzy pomocí animace až přes dvě nezávislé proměnné
· vizuální filtrování dat a informací
· možnost pohledů od globálních po detaily
· vlastní řízení úhlu pohledu na data a zobrazení
Hardwarové nároky
Pro účely dolování dat je nezbytné nasadit počítače s vysokou propustností a stupňovatelností výkonu (s rostoucím objemem dat). Důležitým rysem je i případný paralelismus při zpracování dat pro urychlení výpočtů. Ke splnění požadavku vizualizace je nutný dobrý grafický hardware. Celkově je tedy nutno pro účely vizuálního zpracování velkého množství dat použít výkonný hardware se stabilním operačním systémem a pokud možno se zaručenou průchodností systému.
Závěrem
Důsledné a účelné využití techniky dolování dat pro management firmy dává zcela zřejmou výhodu firmám, které jsou (nebo předvídají, že budou) pod velkým konkurenčním tlakem. Těžba dat již dnes nachází své místo na průmyslových trzích, v obchodě, v telekomunikacích i ve vládním a finančním sektoru, kde je silným nástrojem pro podporu rozhodovacích procesů. Bude zajímavé sledovat vývoj v této oblasti a jeho praktické uplatnění v našich podmínkách.
Silicon Graphics s.r.o.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.
![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 | 1 |
2 | 3 | 4 | 5 | 6 | 7 | 8 |
IT Systems podporuje
Formulář pro přidání akce
Další vybrané akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |