- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)
Tematické sekce


















Branžové sekce
![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Partneři webu
IT SYSTEMS 1-2/2007 , AI a Business Intelligence
V současném vysoce konkurenčním prostředí je pro organizace, bez ohledu na jejich velikost, velice důležitá schopnost dobře poznat potřeby, očekávání a hlavně chování svých zákazníků či odhalení slabých míst podnikových procesů. K dosažení tohoto poznání se dnes stále více využívá prediktivní analýza, a zejména data mining. Data mining je vnímán jako soustava predikčních postupů k transformaci datových zdrojů na informaci podporující v organizaci řízení, rozhodování či plnění obchodních cílů. Nejde přitom o nástroj určený pouze pro velké firmy vybavené rozsáhlou technologickou infrastrukturou, podnikovými informačními systémy, datovými sklady nebo databázemi se stovkami tisíc záznamů. I ve střední a malé organizaci lze tyto postupy využít s relativně stejným přínosem jako ve velkých firmách.
Úspěch dataminingové úlohy je spíše než na množství dostupných dat závislý na správně definovaných cílech, kvalitě použitých dat, vhodném modelu apod. Není pravdou, že jde jen o záležitost technických guru a odborníků na databáze. Pro úspěšné zvládnutí jednoduššího dataminingového projektu v malé organizaci postačuje pochopení základních postupů a technik, podpořené například základním vyškolením podnikového analytika. Ve spojení s kvalitním softwarovým nástrojem pak může technická stránka řešení být otázkou vizuálního programování bez nutnosti zápisu jakýchkoli programových kódů.
Smyslem a hlavním přínosem dataminingových úloh je obohacení stávajících procesů o nové znalosti a jejich rychlé, akční využití. Vstupem do algoritmů přitom nemusí být jen databázová data, ale také data výzkumná, monitorovací, sbíraná ručním zápisem apod. Speciálními datovými vstupy jsou například záznamy o aktivitě na webových stránkách (weblogy) nebo nestrukturované textové dokumenty. Vzájemnou kombinací a analýzou výše uvedených dat jsou získány cenné informace pro kvalitnější řízení podnikových procesů.
Bez ohledu na velikost organizace se při řešení úloh postupuje podle standardní metodologie pro řízení dataminingových projektů. Běžně je využívána metodologie CRISP-DM, nezávisle vyvinutá v roce 1999 konsorciem organizací SPSS, NCR, Daimler- Chrysler a OHRA (www.crisp-dm.org). Metodologie popisuje jednotlivé kroky obecné v rovině podle základních fází (porozumění úloze z obchodního hlediska, porozumění datům, příprava dat, modelování, evaluace a přenos do reálného využití) až po dílčí úlohy, které lze využít jako průvodce při řešení konkrétních projektů.
K typickým dataminigovým úlohám patří klasifikace a přímá predikce budoucího chování individuálních subjektů (například odhad pravděpodobnosti nákupu, odchodu zákazníků ke konkurenci nebo odpovědi na e-mail), segmentace (tvorba skupin s obdobnou charakteristikou, určení neobvyklých či podezřelých případů), detekce vztahů mezi položkami (analýza položek v nákupním košíku) nebo analýza sekvencí (typické průchody webovými stránkami).
Široké uplatnění je rovněž v kontrole kvality (analýza příčin a detekce chyb kvality) nebo predikci selhání systémů při monitoringu. On-line sledováním procesů, ale i pohledem na historická, často automaticky sbíraná data, lze například predikovat selhání výrobní jednotky, řídicích systémů a dalších důležitých komponent, jejichž vyřazení z provozu působí nemalé finanční náklady. Při modelování lze rovněž zahrnout interakce vyšších řádů (stroj–operátor), nelineární závislosti apod.
Zejména u malých organizací se nepředpokládá poptávka po všech typech výše uvedených úloh a je pro ně vhodné využití modulárních dataminingových nástrojů. Moduly většinou obsahují skupiny podobných algoritmů nutných pro řešení konkrétně požadovaných úloh. V další části jsou naznačeny ukázky typických úloh, se kterými se lze setkat v malých organizacích. (Ilustrační výstupy byly pořízeny v dataminingovém nástroji pro malé a střední organizace SPSS Clementine. )
Obr. 1: Segmentace
Komplexní analýza dat uchovávaných v databázi včetně přípravné, modelovací a evaluační fáze se stane základem pro akční využití. Zde půjde hlavně o segmentaci zákaznické báze, správné stanovení cenové politiky a ostatních marketingových činností zahrnujících například speciální nabídky nebo větší koncentrace na segment. Obchodním přínosem bude udržení celkově uspokojivých vztahů se zákazníky, posílení loajality a generování dalších příjmů.
Obr. 2: Rozhodovací strom
Základním krokem je porozumění svým zákazníkům a správné určení těch, kteří o doplňkový produkt budou mít zájem. Kombinací databázových a výzkumných dat a rozborem vzorů chování u zákazníků, kteří již obdobný produkt koupili, lze zjistit segmenty, ve kterých zákazníci vykazují vyšší sklony k nákupu. Získaný model je ve svém výsledku vzorec nebo pravidlo shrnující informaci k danému predikčnímu účelu – zde odhadu pravděpodobnosti nákupu. Hlubší pohled zkvalitní vzájemné interakce se zákazníky a zefektivní dosažení požadovaných cílů.
Obr. 3: Pavučinový graf
Komplexní analýza zodpoví otázky typu: Kdo navštěvuje firemní web? Jak se chová typický návštěvník? Má při návštěvě nějaké problémy? Jaké jsou typické průchody webovou prezentací? Analýza může odhalit celou řadu nedostatků, které zhoršují orientaci na webu a ve svém důsledku snižují jeho využívání zákazníky – špatné uspořádání menu, neprůhledná struktura, špatně fungující vyhledávání, nesprávně fungující personalizace pro věrné návštěvníky a další.
Obr. 4: Vizuální programování
Za zmínku stojí také posouzení finanční návratnosti investice do data miningu (ROI). Finanční přínos (měřený například dodatečně generovanými výnosy, redukcí nákladů spojených s finančním krytím neefektivních procesů) většinou pokryje investované náklady již po několika měsících provozu – v závislosti na rozsahu řešení.
Rozvoj data miningu není zdaleka ukončen. Snahou je využít co nejvíce dat a získat tím maximum možné informace. Při vývoji podpůrného softwaru je kladen důraz na otevřenost systému a jeho širokou adaptaci na stávající informační systémy. Pro uživatele je nespornou výhodou jednoduchost ovládání a vysoký stupeň automatizace všech kroků procesu od získávání dat po prezentaci výsledků.
Autor působí jako analytik společnosti SPSS CR.
Data mining v malých a středních organizacích
Petr Vlach



Úspěch dataminingové úlohy je spíše než na množství dostupných dat závislý na správně definovaných cílech, kvalitě použitých dat, vhodném modelu apod. Není pravdou, že jde jen o záležitost technických guru a odborníků na databáze. Pro úspěšné zvládnutí jednoduššího dataminingového projektu v malé organizaci postačuje pochopení základních postupů a technik, podpořené například základním vyškolením podnikového analytika. Ve spojení s kvalitním softwarovým nástrojem pak může technická stránka řešení být otázkou vizuálního programování bez nutnosti zápisu jakýchkoli programových kódů.
Smyslem a hlavním přínosem dataminingových úloh je obohacení stávajících procesů o nové znalosti a jejich rychlé, akční využití. Vstupem do algoritmů přitom nemusí být jen databázová data, ale také data výzkumná, monitorovací, sbíraná ručním zápisem apod. Speciálními datovými vstupy jsou například záznamy o aktivitě na webových stránkách (weblogy) nebo nestrukturované textové dokumenty. Vzájemnou kombinací a analýzou výše uvedených dat jsou získány cenné informace pro kvalitnější řízení podnikových procesů.
Bez ohledu na velikost organizace se při řešení úloh postupuje podle standardní metodologie pro řízení dataminingových projektů. Běžně je využívána metodologie CRISP-DM, nezávisle vyvinutá v roce 1999 konsorciem organizací SPSS, NCR, Daimler- Chrysler a OHRA (www.crisp-dm.org). Metodologie popisuje jednotlivé kroky obecné v rovině podle základních fází (porozumění úloze z obchodního hlediska, porozumění datům, příprava dat, modelování, evaluace a přenos do reálného využití) až po dílčí úlohy, které lze využít jako průvodce při řešení konkrétních projektů.
K typickým dataminigovým úlohám patří klasifikace a přímá predikce budoucího chování individuálních subjektů (například odhad pravděpodobnosti nákupu, odchodu zákazníků ke konkurenci nebo odpovědi na e-mail), segmentace (tvorba skupin s obdobnou charakteristikou, určení neobvyklých či podezřelých případů), detekce vztahů mezi položkami (analýza položek v nákupním košíku) nebo analýza sekvencí (typické průchody webovými stránkami).
Široké uplatnění je rovněž v kontrole kvality (analýza příčin a detekce chyb kvality) nebo predikci selhání systémů při monitoringu. On-line sledováním procesů, ale i pohledem na historická, často automaticky sbíraná data, lze například predikovat selhání výrobní jednotky, řídicích systémů a dalších důležitých komponent, jejichž vyřazení z provozu působí nemalé finanční náklady. Při modelování lze rovněž zahrnout interakce vyšších řádů (stroj–operátor), nelineární závislosti apod.
Zejména u malých organizací se nepředpokládá poptávka po všech typech výše uvedených úloh a je pro ně vhodné využití modulárních dataminingových nástrojů. Moduly většinou obsahují skupiny podobných algoritmů nutných pro řešení konkrétně požadovaných úloh. V další části jsou naznačeny ukázky typických úloh, se kterými se lze setkat v malých organizacích. (Ilustrační výstupy byly pořízeny v dataminingovém nástroji pro malé a střední organizace SPSS Clementine. )

Obr. 1: Segmentace
Příklad první
Malá obchodní organizace obsluhuje omezený počet zákazníků, mezi kterými však existují určité rozdíly odpovídající například průměrné velikosti objednávek, typu nakupovaných výrobků a služeb, sezonnosti v poptávce nebo v platební historii. Organizace se potýká s problémem odchodu svých zákazníků ke konkurenci. Hledá odpovědi na otázky typu: Jak posílit loajalitu zákazníků? Existují skupiny více a méně loajálních zákazníků? Co je pro tyto skupiny typické? Lze loajalitu zákazníků pozitivně ovlivnit?Komplexní analýza dat uchovávaných v databázi včetně přípravné, modelovací a evaluační fáze se stane základem pro akční využití. Zde půjde hlavně o segmentaci zákaznické báze, správné stanovení cenové politiky a ostatních marketingových činností zahrnujících například speciální nabídky nebo větší koncentrace na segment. Obchodním přínosem bude udržení celkově uspokojivých vztahů se zákazníky, posílení loajality a generování dalších příjmů.

Obr. 2: Rozhodovací strom
Příklad druhý
Regionální instituce obsluhující tisíce zákazníků hledá způsob, jakým podpořit prodej doplňkových produktů. Až doposud probíhal výběr potenciálních zájemců téměř náhodně a s velmi nízkou odezvou. Instituce proto hledá odpověď na klíčové otázky: Které zákazníky s nabídkou oslovit? Jaká je pravděpodobnost zájmu o nabízený výrobek? Kolik peněz lze ušetřit správně cílenou kampaní?Základním krokem je porozumění svým zákazníkům a správné určení těch, kteří o doplňkový produkt budou mít zájem. Kombinací databázových a výzkumných dat a rozborem vzorů chování u zákazníků, kteří již obdobný produkt koupili, lze zjistit segmenty, ve kterých zákazníci vykazují vyšší sklony k nákupu. Získaný model je ve svém výsledku vzorec nebo pravidlo shrnující informaci k danému predikčnímu účelu – zde odhadu pravděpodobnosti nákupu. Hlubší pohled zkvalitní vzájemné interakce se zákazníky a zefektivní dosažení požadovaných cílů.

Obr. 3: Pavučinový graf
Příklad třetí
Firma provozující webovou prezentaci včetně on-line shopu potřebuje lépe porozumět chování svých návštěvníků. Zatím sledovala pouze počty přístupů a počty přijatých on-line objednávek. Cílem dataminingového projektu je zvýšení efektivity prodejního kanálu měřeného podílem on-line přijatých objednávek a zároveň zvýšení návštěvnosti webu. Datovým vstupem jsou podrobné záznamy o chování zákazníků v minulosti (weblogy), které jsou k dispozici u většiny poskytovatelů webového připojení.Komplexní analýza zodpoví otázky typu: Kdo navštěvuje firemní web? Jak se chová typický návštěvník? Má při návštěvě nějaké problémy? Jaké jsou typické průchody webovou prezentací? Analýza může odhalit celou řadu nedostatků, které zhoršují orientaci na webu a ve svém důsledku snižují jeho využívání zákazníky – špatné uspořádání menu, neprůhledná struktura, špatně fungující vyhledávání, nesprávně fungující personalizace pro věrné návštěvníky a další.

Obr. 4: Vizuální programování
Závěrem
Prediktivní analýzy se dnes stávají nezbytnou součástí dobře fungující organizace. Platí to pro firmy velké i malé. Nesprávně zavedené procesy se stávají přímou hrozbou pro další existenci podniku, a je jim proto třeba věnovat zvýšenou pozornost. Jde zejména o nutnost okamžité (on-line) a správné reakce na stále rychlejší podněty okolí.Za zmínku stojí také posouzení finanční návratnosti investice do data miningu (ROI). Finanční přínos (měřený například dodatečně generovanými výnosy, redukcí nákladů spojených s finančním krytím neefektivních procesů) většinou pokryje investované náklady již po několika měsících provozu – v závislosti na rozsahu řešení.
Rozvoj data miningu není zdaleka ukončen. Snahou je využít co nejvíce dat a získat tím maximum možné informace. Při vývoji podpůrného softwaru je kladen důraz na otevřenost systému a jeho širokou adaptaci na stávající informační systémy. Pro uživatele je nespornou výhodou jednoduchost ovládání a vysoký stupeň automatizace všech kroků procesu od získávání dat po prezentaci výsledků.
Autor působí jako analytik společnosti SPSS CR.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 1 | 2 | 3 | 4 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
IT Systems podporuje
Formulář pro přidání akce
Další vybrané akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |