- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (80)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
Tematické sekce
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tiskBranové sekce
![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Partneři webu
IT SYSTEM 6/2004
Objevte hodnoty skryté ve vaich datech
Jaká je současnost a budoucnost data miningu?
Mgr. Michal kop
Data mining, česky té vytěování dat, dnes ji natěstí není třeba obírněji představovat. Tento pojem u se zabydlel v naem slovníku a nelze očekávat, e by jej měl opustit, ba právě naopak. Důleitost získávání významných (na první pohled skrytých) znalostí pro správná rozhodnutí z velkého mnoství různých dat bude do budoucna jenom růst. Zkusme si trochu blíe přiblíit aktuální situaci v tomto perspektivním oboru a nebojme se podívat i do budoucna.
Současný data mining
Typy společností
Nejprve se podívejme, kde a jak se data mining v současné době pouívá. Při bliím pohledu můeme pro někoho a moná překvapivě zjistit, e pouití data miningu je ji rozvinuto v mnoha nejrůznějích a od sebe poměrně vzdálených oblastech. Mezi společnostmi, kde je nasazení data miningu nejdále, se bezpochyby řadí banky, pojiovny a finanční instituce vůbec, dále telekomunikační či farmaceutické společnosti. Také sem můeme zařadit velké prodejní řetězce, specializované marketingové společnosti a utility, u nich lze zaznamenat bouřlivý rozvoj zvlátě v poslední době. Z tohoto krátkého přehledu lze ale uvést alespoň jeden jejich společný znak - v současnosti se jedná spíe o větí společnosti.
Typy projektů
Můeme se té podívat na aktuální stav data miningu z jiného pohledu a zaměřit se na převaující povahu data miningových projektů. V takovém případě na prvním místě rozpoznáme projekty zaměřené na CRM, a to jak v oblasti segmentace, tak například v analýze přínosů jednotlivých marketingových strategií - to se týká prakticky vech výe vyjmenovaných typů společností. Dále se jedná o projekty zaměřené na management rizika (finanční instituce), poskytování úvěrů (bankovnictví, stavební spořitelny), management a predikci zřídka se vyskytujících událostí (finanční instituce), projekty mající za úlohu analyzovat odchod zákazníků - churn - a účinně mu předcházet (to se týká v první řadě telekomunikačních společností) nebo projekty zaměřené na nákupní zvyklosti zákazníků (prodejní řetězce, marketingové společnosti). Zcela jiný typ vyuití data miningu představuje oblast výzkumu, kde jsou typickými reprezentanty farmaceutické společnosti.
Metody
Jako doplnění můeme uvést i malý přehled metod, které patří v současné době mezi nejpopulárnějí pro pouití v data miningových projektech. Určitě mezi ně patří klasifikační stromy, support vector machines nebo metody nejbliího souseda pro klasifikační problémy, regresní stromy pro problémy regresní. Jak pro klasifikační, tak pro regresní problémy se pouívají zobecněné aditivní modely, neuronové sítě, MAR spliny nebo CHAID a "boosted" stromy. Pro tzv. analýzu nákupního koíku je typické nasazení asociačních pravidel a pro segmentaci se s úspěchem pouívá různých typů shlukování (EM, k-průměrů) či opět neuronových sítí.
Důleité faktory pro data mining
Zkusme nyní společně identifikovat hlavní faktory, které ovlivňují úspěné nasazení data miningu.
Lidé
Na jednom z čelných míst stojí (tak jako v mnoha jiných případech) lidé. Data miningové postupy nejsou jednoduché a jejich optimální nasazení vyaduje od analytiků notnou dávku zkueností a znalostí. To reflektuje i neustále se roziřující nabídka kurzů data miningu nebo intenzivních kolení přímo v prostředí zákazníka. Osvědčuje se také vedení projektu specialisty mimo samotnou společnost či alespoň jeho konzultace s nimi. S povděkem lze také kvitovat, e data mining není opomíjen ani univerzitami (a to i v ČR či na Slovensku), které se té podílejí na přípravě analytiků či na dalím rozvoji a popularizaci pouívaných metod.
Data
Druhým zásadním faktorem je stav a dostupnost vhodných dat. Ostatně tento předpoklad je ji obsazen i v samotném názvu data mining - vytěování dat. Vhodně spravovaná data lze snadno pouít a dochází tím jednak k úspoře času při data miningu, tak lze pouít větí mnoství různých dat a tím samozřejmě získat lepí výsledky. V současné době se stále jetě příli mnoho drahocenného času ztrácí větinou samotnou přípravou dat.
Software
Dalím z nejdůleitějích faktorů je oblast softwarové podpory. Moderní systémy pro data mining u dávno nejsou oputěné ostrůvky v moři, ale umoňují propojení na stávající systémy pouívané v té které společnosti. Samozřejmě primárně se jedná o stávající databázi či systém reportování, ale nejen o ně (můe jít např. i o iroké propojení vech poboček na základě internetových technologií). Také je stále více vyadována otevřenost vlastního systému, aby jej bylo mono upravit podle konkrétních potřeb společnosti - např. přidáním originální metody či postupu, které je potom moné pouít stejně jako původní dodané ji od poskytovatele softwarového řeení. Nezapomínejme, e i poadavky na rychlost a objem zpracování dat rostou podobně jako v jiných oblastech ohromným tempem. To ve klade vysoké nároky na systémy pro data mining a je pravdou, e jim v poslední době dokáe vyhovět jen několik systémů.
Opět lidé
Posledním ze zásadních faktorů, last but not least, je podpora managementu společnosti. Data miningové projekty obecně nejsou jednoduché, jsou i časově náročné a vyadují dostatečné zabezpečení (viz jen předchozí tři hlavní faktory). Proto je podpora managementu nezbytností.
Budoucnost data miningu
Nikdo z nás nemá křiálovou kouli, v ni by mohl nahlédnout do budoucnosti, ale můeme alespoň popsat trendy, které jsou v posledních letech v data miningu určující.
Rozíření
Jedním z trendů je neustálé roziřování skupiny společností, které pouívají data miningové postupy. Protoe se jednoznačně ukazuje, e data mining prostě funguje, e jeho přínosy jsou neoddiskutovatelné, tak je samozřejmé, e také stále více společností začne data miningových postupů pouívat. Podobně lze očekávat, e se tímto způsobem rozíří i do stále meních společností.
Prohloubení
Je obvyklé, e společnosti nejprve vyzkouejí data mining na jeden jednoduí pilotní projekt. Lze vysledovat, e obvykle jej po poměrně krátké době začínají pouívat na dalí projekty a ve více oblastech. Také se obvykle "osmělí" a začínají pouívat stále více různých sofistikovanějích metod.
Nový směr - text mining
Lze očekávat, e půjde v blízké budoucnosti o důleitý, ne-li nejdůleitějí směr rozvoje. Zdaleka ne kadá společnost má vhodná data pro data mining, ovem kadá společnost pouívá mnoství textových dokumentů. Ji současné komerčně dostupné technologie dokáí "přečíst" dokumenty automaticky a získat z nich alespoň část informace. Pokud se ovem vezme v úvahu velké mnoství textových dokumentů, souhrn i těchto neúplných informací získaných z kadého z nich přináí celkově velmi podstatné znalosti. Také analýza webu se bude zajisté nadále roziřovat (pro pouití data miningových postupů k analýze webu se vívá termín web mining).
Nový směr - QC mining
QC mining je spojením ji velmi dlouho zavedených metod pro analýzu výrobních procesů (QC - quality control) s metodami data miningu. Cílem je posunout analýzu výrobních procesů a namísto reagování na problémy jim začít účinně předcházet. Toho lze pomocí QC miningu dosáhnout. Perspektivně se té v této souvislosti jeví pouití data miningových postupů při aplikaci metodologie Six Sigma.
Autor článku, Mgr. Michal kop, je senior konzultantem společnosti StatSoft CR.

Současný data mining
Typy společností
Nejprve se podívejme, kde a jak se data mining v současné době pouívá. Při bliím pohledu můeme pro někoho a moná překvapivě zjistit, e pouití data miningu je ji rozvinuto v mnoha nejrůznějích a od sebe poměrně vzdálených oblastech. Mezi společnostmi, kde je nasazení data miningu nejdále, se bezpochyby řadí banky, pojiovny a finanční instituce vůbec, dále telekomunikační či farmaceutické společnosti. Také sem můeme zařadit velké prodejní řetězce, specializované marketingové společnosti a utility, u nich lze zaznamenat bouřlivý rozvoj zvlátě v poslední době. Z tohoto krátkého přehledu lze ale uvést alespoň jeden jejich společný znak - v současnosti se jedná spíe o větí společnosti.
Typy projektů
Můeme se té podívat na aktuální stav data miningu z jiného pohledu a zaměřit se na převaující povahu data miningových projektů. V takovém případě na prvním místě rozpoznáme projekty zaměřené na CRM, a to jak v oblasti segmentace, tak například v analýze přínosů jednotlivých marketingových strategií - to se týká prakticky vech výe vyjmenovaných typů společností. Dále se jedná o projekty zaměřené na management rizika (finanční instituce), poskytování úvěrů (bankovnictví, stavební spořitelny), management a predikci zřídka se vyskytujících událostí (finanční instituce), projekty mající za úlohu analyzovat odchod zákazníků - churn - a účinně mu předcházet (to se týká v první řadě telekomunikačních společností) nebo projekty zaměřené na nákupní zvyklosti zákazníků (prodejní řetězce, marketingové společnosti). Zcela jiný typ vyuití data miningu představuje oblast výzkumu, kde jsou typickými reprezentanty farmaceutické společnosti.
Metody
Jako doplnění můeme uvést i malý přehled metod, které patří v současné době mezi nejpopulárnějí pro pouití v data miningových projektech. Určitě mezi ně patří klasifikační stromy, support vector machines nebo metody nejbliího souseda pro klasifikační problémy, regresní stromy pro problémy regresní. Jak pro klasifikační, tak pro regresní problémy se pouívají zobecněné aditivní modely, neuronové sítě, MAR spliny nebo CHAID a "boosted" stromy. Pro tzv. analýzu nákupního koíku je typické nasazení asociačních pravidel a pro segmentaci se s úspěchem pouívá různých typů shlukování (EM, k-průměrů) či opět neuronových sítí.
Důleité faktory pro data mining
Zkusme nyní společně identifikovat hlavní faktory, které ovlivňují úspěné nasazení data miningu.
Lidé
Na jednom z čelných míst stojí (tak jako v mnoha jiných případech) lidé. Data miningové postupy nejsou jednoduché a jejich optimální nasazení vyaduje od analytiků notnou dávku zkueností a znalostí. To reflektuje i neustále se roziřující nabídka kurzů data miningu nebo intenzivních kolení přímo v prostředí zákazníka. Osvědčuje se také vedení projektu specialisty mimo samotnou společnost či alespoň jeho konzultace s nimi. S povděkem lze také kvitovat, e data mining není opomíjen ani univerzitami (a to i v ČR či na Slovensku), které se té podílejí na přípravě analytiků či na dalím rozvoji a popularizaci pouívaných metod.
Data
Druhým zásadním faktorem je stav a dostupnost vhodných dat. Ostatně tento předpoklad je ji obsazen i v samotném názvu data mining - vytěování dat. Vhodně spravovaná data lze snadno pouít a dochází tím jednak k úspoře času při data miningu, tak lze pouít větí mnoství různých dat a tím samozřejmě získat lepí výsledky. V současné době se stále jetě příli mnoho drahocenného času ztrácí větinou samotnou přípravou dat.
Software
Dalím z nejdůleitějích faktorů je oblast softwarové podpory. Moderní systémy pro data mining u dávno nejsou oputěné ostrůvky v moři, ale umoňují propojení na stávající systémy pouívané v té které společnosti. Samozřejmě primárně se jedná o stávající databázi či systém reportování, ale nejen o ně (můe jít např. i o iroké propojení vech poboček na základě internetových technologií). Také je stále více vyadována otevřenost vlastního systému, aby jej bylo mono upravit podle konkrétních potřeb společnosti - např. přidáním originální metody či postupu, které je potom moné pouít stejně jako původní dodané ji od poskytovatele softwarového řeení. Nezapomínejme, e i poadavky na rychlost a objem zpracování dat rostou podobně jako v jiných oblastech ohromným tempem. To ve klade vysoké nároky na systémy pro data mining a je pravdou, e jim v poslední době dokáe vyhovět jen několik systémů.
Opět lidé
Posledním ze zásadních faktorů, last but not least, je podpora managementu společnosti. Data miningové projekty obecně nejsou jednoduché, jsou i časově náročné a vyadují dostatečné zabezpečení (viz jen předchozí tři hlavní faktory). Proto je podpora managementu nezbytností.
Budoucnost data miningu
Nikdo z nás nemá křiálovou kouli, v ni by mohl nahlédnout do budoucnosti, ale můeme alespoň popsat trendy, které jsou v posledních letech v data miningu určující.
Rozíření
Jedním z trendů je neustálé roziřování skupiny společností, které pouívají data miningové postupy. Protoe se jednoznačně ukazuje, e data mining prostě funguje, e jeho přínosy jsou neoddiskutovatelné, tak je samozřejmé, e také stále více společností začne data miningových postupů pouívat. Podobně lze očekávat, e se tímto způsobem rozíří i do stále meních společností.
Prohloubení
Je obvyklé, e společnosti nejprve vyzkouejí data mining na jeden jednoduí pilotní projekt. Lze vysledovat, e obvykle jej po poměrně krátké době začínají pouívat na dalí projekty a ve více oblastech. Také se obvykle "osmělí" a začínají pouívat stále více různých sofistikovanějích metod.
Nový směr - text mining
Lze očekávat, e půjde v blízké budoucnosti o důleitý, ne-li nejdůleitějí směr rozvoje. Zdaleka ne kadá společnost má vhodná data pro data mining, ovem kadá společnost pouívá mnoství textových dokumentů. Ji současné komerčně dostupné technologie dokáí "přečíst" dokumenty automaticky a získat z nich alespoň část informace. Pokud se ovem vezme v úvahu velké mnoství textových dokumentů, souhrn i těchto neúplných informací získaných z kadého z nich přináí celkově velmi podstatné znalosti. Také analýza webu se bude zajisté nadále roziřovat (pro pouití data miningových postupů k analýze webu se vívá termín web mining).
Nový směr - QC mining
QC mining je spojením ji velmi dlouho zavedených metod pro analýzu výrobních procesů (QC - quality control) s metodami data miningu. Cílem je posunout analýzu výrobních procesů a namísto reagování na problémy jim začít účinně předcházet. Toho lze pomocí QC miningu dosáhnout. Perspektivně se té v této souvislosti jeví pouití data miningových postupů při aplikaci metodologie Six Sigma.
Autor článku, Mgr. Michal kop, je senior konzultantem společnosti StatSoft CR.
Chcete získat časopis IT Systems s tímto a mnoha dalími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z naeho archivu.


















