- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)
Tematické sekce


















Branžové sekce
![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Partneři webu
IT SYSTEM 6/2004
Objevte hodnoty skryté ve vašich datech
Jaká je současnost a budoucnost data miningu?
Mgr. Michal Škop
Data mining, česky též vytěžování dat, dnes již naštěstí není třeba obšírněji představovat. Tento pojem už se zabydlel v našem slovníku a nelze očekávat, že by jej měl opustit, ba právě naopak. Důležitost získávání významných (na první pohled skrytých) znalostí pro správná rozhodnutí z velkého množství různých dat bude do budoucna jenom růst. Zkusme si trochu blíže přiblížit aktuální situaci v tomto perspektivním oboru a nebojme se podívat i do budoucna.
Současný data mining
Typy společností
Nejprve se podívejme, kde a jak se data mining v současné době používá. Při bližším pohledu můžeme pro někoho až možná překvapivě zjistit, že použití data miningu je již rozvinuto v mnoha nejrůznějších a od sebe poměrně vzdálených oblastech. Mezi společnostmi, kde je nasazení data miningu nejdále, se bezpochyby řadí banky, pojišťovny a finanční instituce vůbec, dále telekomunikační či farmaceutické společnosti. Také sem můžeme zařadit velké prodejní řetězce, specializované marketingové společnosti a utility, u nichž lze zaznamenat bouřlivý rozvoj zvláště v poslední době. Z tohoto krátkého přehledu lze ale uvést alespoň jeden jejich společný znak - v současnosti se jedná spíše o větší společnosti.
Typy projektů
Můžeme se též podívat na aktuální stav data miningu z jiného pohledu a zaměřit se na převažující povahu data miningových projektů. V takovém případě na prvním místě rozpoznáme projekty zaměřené na CRM, a to jak v oblasti segmentace, tak například v analýze přínosů jednotlivých marketingových strategií - to se týká prakticky všech výše vyjmenovaných typů společností. Dále se jedná o projekty zaměřené na management rizika (finanční instituce), poskytování úvěrů (bankovnictví, stavební spořitelny), management a predikci zřídka se vyskytujících událostí (finanční instituce), projekty mající za úlohu analyzovat odchod zákazníků - churn - a účinně mu předcházet (to se týká v první řadě telekomunikačních společností) nebo projekty zaměřené na nákupní zvyklosti zákazníků (prodejní řetězce, marketingové společnosti). Zcela jiný typ využití data miningu představuje oblast výzkumu, kde jsou typickými reprezentanty farmaceutické společnosti.
Metody
Jako doplnění můžeme uvést i malý přehled metod, které patří v současné době mezi nejpopulárnější pro použití v data miningových projektech. Určitě mezi ně patří klasifikační stromy, support vector machines nebo metody nejbližšího souseda pro klasifikační problémy, regresní stromy pro problémy regresní. Jak pro klasifikační, tak pro regresní problémy se používají zobecněné aditivní modely, neuronové sítě, MAR spliny nebo CHAID a "boosted" stromy. Pro tzv. analýzu nákupního košíku je typické nasazení asociačních pravidel a pro segmentaci se s úspěchem používá různých typů shlukování (EM, k-průměrů) či opět neuronových sítí.
Důležité faktory pro data mining
Zkusme nyní společně identifikovat hlavní faktory, které ovlivňují úspěšné nasazení data miningu.
Lidé
Na jednom z čelných míst stojí (tak jako v mnoha jiných případech) lidé. Data miningové postupy nejsou jednoduché a jejich optimální nasazení vyžaduje od analytiků notnou dávku zkušeností a znalostí. To reflektuje i neustále se rozšiřující nabídka kurzů data miningu nebo intenzivních školení přímo v prostředí zákazníka. Osvědčuje se také vedení projektu specialisty mimo samotnou společnost či alespoň jeho konzultace s nimi. S povděkem lze také kvitovat, že data mining není opomíjen ani univerzitami (a to i v ČR či na Slovensku), které se též podílejí na přípravě analytiků či na dalším rozvoji a popularizaci používaných metod.
Data
Druhým zásadním faktorem je stav a dostupnost vhodných dat. Ostatně tento předpoklad je již obsazen i v samotném názvu data mining - vytěžování dat. Vhodně spravovaná data lze snadno použít a dochází tím jednak k úspoře času při data miningu, tak lze použít větší množství různých dat a tím samozřejmě získat lepší výsledky. V současné době se stále ještě příliš mnoho drahocenného času ztrácí většinou samotnou přípravou dat.
Software
Dalším z nejdůležitějších faktorů je oblast softwarové podpory. Moderní systémy pro data mining už dávno nejsou opuštěné ostrůvky v moři, ale umožňují propojení na stávající systémy používané v té které společnosti. Samozřejmě primárně se jedná o stávající databázi či systém reportování, ale nejen o ně (může jít např. i o široké propojení všech poboček na základě internetových technologií). Také je stále více vyžadována otevřenost vlastního systému, aby jej bylo možno upravit podle konkrétních potřeb společnosti - např. přidáním originální metody či postupu, které je potom možné použít stejně jako původní dodané již od poskytovatele softwarového řešení. Nezapomínejme, že i požadavky na rychlost a objem zpracování dat rostou podobně jako v jiných oblastech ohromným tempem. To vše klade vysoké nároky na systémy pro data mining a je pravdou, že jim v poslední době dokáže vyhovět jen několik systémů.
Opět lidé
Posledním ze zásadních faktorů, last but not least, je podpora managementu společnosti. Data miningové projekty obecně nejsou jednoduché, jsou i časově náročné a vyžadují dostatečné zabezpečení (viz jen předchozí tři hlavní faktory). Proto je podpora managementu nezbytností.
Budoucnost data miningu
Nikdo z nás nemá křišťálovou kouli, v niž by mohl nahlédnout do budoucnosti, ale můžeme alespoň popsat trendy, které jsou v posledních letech v data miningu určující.
Rozšíření
Jedním z trendů je neustálé rozšiřování skupiny společností, které používají data miningové postupy. Protože se jednoznačně ukazuje, že data mining prostě funguje, že jeho přínosy jsou neoddiskutovatelné, tak je samozřejmé, že také stále více společností začne data miningových postupů používat. Podobně lze očekávat, že se tímto způsobem rozšíří i do stále menších společností.
Prohloubení
Je obvyklé, že společnosti nejprve vyzkoušejí data mining na jeden jednodušší pilotní projekt. Lze vysledovat, že obvykle jej po poměrně krátké době začínají používat na další projekty a ve více oblastech. Také se obvykle "osmělí" a začínají používat stále více různých sofistikovanějších metod.
Nový směr - text mining
Lze očekávat, že půjde v blízké budoucnosti o důležitý, ne-li nejdůležitější směr rozvoje. Zdaleka ne každá společnost má vhodná data pro data mining, ovšem každá společnost používá množství textových dokumentů. Již současné komerčně dostupné technologie dokáží "přečíst" dokumenty automaticky a získat z nich alespoň část informace. Pokud se ovšem vezme v úvahu velké množství textových dokumentů, souhrn i těchto neúplných informací získaných z každého z nich přináší celkově velmi podstatné znalosti. Také analýza webu se bude zajisté nadále rozšiřovat (pro použití data miningových postupů k analýze webu se vžívá termín web mining).
Nový směr - QC mining
QC mining je spojením již velmi dlouho zavedených metod pro analýzu výrobních procesů (QC - quality control) s metodami data miningu. Cílem je posunout analýzu výrobních procesů a namísto reagování na problémy jim začít účinně předcházet. Toho lze pomocí QC miningu dosáhnout. Perspektivně se též v této souvislosti jeví použití data miningových postupů při aplikaci metodologie Six Sigma.
Autor článku, Mgr. Michal Škop, je senior konzultantem společnosti StatSoft CR.



Současný data mining
Typy společností
Nejprve se podívejme, kde a jak se data mining v současné době používá. Při bližším pohledu můžeme pro někoho až možná překvapivě zjistit, že použití data miningu je již rozvinuto v mnoha nejrůznějších a od sebe poměrně vzdálených oblastech. Mezi společnostmi, kde je nasazení data miningu nejdále, se bezpochyby řadí banky, pojišťovny a finanční instituce vůbec, dále telekomunikační či farmaceutické společnosti. Také sem můžeme zařadit velké prodejní řetězce, specializované marketingové společnosti a utility, u nichž lze zaznamenat bouřlivý rozvoj zvláště v poslední době. Z tohoto krátkého přehledu lze ale uvést alespoň jeden jejich společný znak - v současnosti se jedná spíše o větší společnosti.
Typy projektů
Můžeme se též podívat na aktuální stav data miningu z jiného pohledu a zaměřit se na převažující povahu data miningových projektů. V takovém případě na prvním místě rozpoznáme projekty zaměřené na CRM, a to jak v oblasti segmentace, tak například v analýze přínosů jednotlivých marketingových strategií - to se týká prakticky všech výše vyjmenovaných typů společností. Dále se jedná o projekty zaměřené na management rizika (finanční instituce), poskytování úvěrů (bankovnictví, stavební spořitelny), management a predikci zřídka se vyskytujících událostí (finanční instituce), projekty mající za úlohu analyzovat odchod zákazníků - churn - a účinně mu předcházet (to se týká v první řadě telekomunikačních společností) nebo projekty zaměřené na nákupní zvyklosti zákazníků (prodejní řetězce, marketingové společnosti). Zcela jiný typ využití data miningu představuje oblast výzkumu, kde jsou typickými reprezentanty farmaceutické společnosti.
Metody
Jako doplnění můžeme uvést i malý přehled metod, které patří v současné době mezi nejpopulárnější pro použití v data miningových projektech. Určitě mezi ně patří klasifikační stromy, support vector machines nebo metody nejbližšího souseda pro klasifikační problémy, regresní stromy pro problémy regresní. Jak pro klasifikační, tak pro regresní problémy se používají zobecněné aditivní modely, neuronové sítě, MAR spliny nebo CHAID a "boosted" stromy. Pro tzv. analýzu nákupního košíku je typické nasazení asociačních pravidel a pro segmentaci se s úspěchem používá různých typů shlukování (EM, k-průměrů) či opět neuronových sítí.
Důležité faktory pro data mining
Zkusme nyní společně identifikovat hlavní faktory, které ovlivňují úspěšné nasazení data miningu.
Lidé
Na jednom z čelných míst stojí (tak jako v mnoha jiných případech) lidé. Data miningové postupy nejsou jednoduché a jejich optimální nasazení vyžaduje od analytiků notnou dávku zkušeností a znalostí. To reflektuje i neustále se rozšiřující nabídka kurzů data miningu nebo intenzivních školení přímo v prostředí zákazníka. Osvědčuje se také vedení projektu specialisty mimo samotnou společnost či alespoň jeho konzultace s nimi. S povděkem lze také kvitovat, že data mining není opomíjen ani univerzitami (a to i v ČR či na Slovensku), které se též podílejí na přípravě analytiků či na dalším rozvoji a popularizaci používaných metod.
Data
Druhým zásadním faktorem je stav a dostupnost vhodných dat. Ostatně tento předpoklad je již obsazen i v samotném názvu data mining - vytěžování dat. Vhodně spravovaná data lze snadno použít a dochází tím jednak k úspoře času při data miningu, tak lze použít větší množství různých dat a tím samozřejmě získat lepší výsledky. V současné době se stále ještě příliš mnoho drahocenného času ztrácí většinou samotnou přípravou dat.
Software
Dalším z nejdůležitějších faktorů je oblast softwarové podpory. Moderní systémy pro data mining už dávno nejsou opuštěné ostrůvky v moři, ale umožňují propojení na stávající systémy používané v té které společnosti. Samozřejmě primárně se jedná o stávající databázi či systém reportování, ale nejen o ně (může jít např. i o široké propojení všech poboček na základě internetových technologií). Také je stále více vyžadována otevřenost vlastního systému, aby jej bylo možno upravit podle konkrétních potřeb společnosti - např. přidáním originální metody či postupu, které je potom možné použít stejně jako původní dodané již od poskytovatele softwarového řešení. Nezapomínejme, že i požadavky na rychlost a objem zpracování dat rostou podobně jako v jiných oblastech ohromným tempem. To vše klade vysoké nároky na systémy pro data mining a je pravdou, že jim v poslední době dokáže vyhovět jen několik systémů.
Opět lidé
Posledním ze zásadních faktorů, last but not least, je podpora managementu společnosti. Data miningové projekty obecně nejsou jednoduché, jsou i časově náročné a vyžadují dostatečné zabezpečení (viz jen předchozí tři hlavní faktory). Proto je podpora managementu nezbytností.
Budoucnost data miningu
Nikdo z nás nemá křišťálovou kouli, v niž by mohl nahlédnout do budoucnosti, ale můžeme alespoň popsat trendy, které jsou v posledních letech v data miningu určující.
Rozšíření
Jedním z trendů je neustálé rozšiřování skupiny společností, které používají data miningové postupy. Protože se jednoznačně ukazuje, že data mining prostě funguje, že jeho přínosy jsou neoddiskutovatelné, tak je samozřejmé, že také stále více společností začne data miningových postupů používat. Podobně lze očekávat, že se tímto způsobem rozšíří i do stále menších společností.
Prohloubení
Je obvyklé, že společnosti nejprve vyzkoušejí data mining na jeden jednodušší pilotní projekt. Lze vysledovat, že obvykle jej po poměrně krátké době začínají používat na další projekty a ve více oblastech. Také se obvykle "osmělí" a začínají používat stále více různých sofistikovanějších metod.
Nový směr - text mining
Lze očekávat, že půjde v blízké budoucnosti o důležitý, ne-li nejdůležitější směr rozvoje. Zdaleka ne každá společnost má vhodná data pro data mining, ovšem každá společnost používá množství textových dokumentů. Již současné komerčně dostupné technologie dokáží "přečíst" dokumenty automaticky a získat z nich alespoň část informace. Pokud se ovšem vezme v úvahu velké množství textových dokumentů, souhrn i těchto neúplných informací získaných z každého z nich přináší celkově velmi podstatné znalosti. Také analýza webu se bude zajisté nadále rozšiřovat (pro použití data miningových postupů k analýze webu se vžívá termín web mining).
Nový směr - QC mining
QC mining je spojením již velmi dlouho zavedených metod pro analýzu výrobních procesů (QC - quality control) s metodami data miningu. Cílem je posunout analýzu výrobních procesů a namísto reagování na problémy jim začít účinně předcházet. Toho lze pomocí QC miningu dosáhnout. Perspektivně se též v této souvislosti jeví použití data miningových postupů při aplikaci metodologie Six Sigma.
Autor článku, Mgr. Michal Škop, je senior konzultantem společnosti StatSoft CR.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.
![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 1 | 2 | 3 | 4 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
IT Systems podporuje
Formulář pro přidání akce
Další vybrané akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |