- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)


















![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Využíváte efektivně potenciál skrytý v datech?
Praktický příklad využití data miningu
V databázích, zejména velkých společností, bývá uloženo množství informací, které v případě efektivního zpracování mohou přinést nemalé úspory a zvýšit šance uspět v silném konkurenčním boji. A právě proces data miningu (dolování dat) umožňuje nalézt souvislosti v datech, které nejsou přímo zřejmé a které napomáhají lépe porozumět firemním procesům a obstát v konkurenčním prostředí.


Využívání data miningu v posledních letech výrazně roste a jde napříč obory. Typickými uživateli těchto nástrojů jsou společnosti z bankovního sektoru, pojišťovny nebo například telekomunikace. Data mining se čím dál více využívá také v různých obchodních společnostech, službách či státní správě. Velké datové sklady přímo vybízí k lepšímu využívání cenných informací.
V tomto článku se zaměříme na dataminingové úlohy týkající se hledání asociací a sekvencí v datech. Tyto metody mohou výrazně pomoci například při plánování marketingových strategií, tvorbě produktových balíčků, při péči o zákazníky, detekci podvodů atd.
Zdroj dat
Data se týkají prodeje náhradních dílů pro „bílé zboží“ jedné nadnárodní společnosti. Sledována byla skupina zákazníků, kteří nakoupili zboží u konkrétních prodejců této společnosti v určitém období. Celkově se jedná o 898 zákazníků, kteří nakupovali u osmi prodejců v průběhu šesti měsíců (viz tab. 1). Datový zdroj obsahuje datum a den v týdnu, kdy se prodej uskutečnil, a dále místo sídla prodejce, kde bylo zboží objednáno. Každá komponenta má svůj identifikátor (ID produktu). Jednotliví zákazníci jsou vedeni pod identifikačním číslem (ID zakaznika) a je patrné, v jakém pořadí uskutečňovali jednotlivé nákupy.
Cíl analýzy
Cílem je popsat typické chování zákazníků, tj. nalézt charakteristické skupiny náhradních dílů „bílého zboží“, které zákazníci odebírají.

Tab. 1: Vstupní data
Výsledek analýzy je podkladem pro tvorbu strategie produktového managementu s cílem rozšířit sortiment zboží odebíraného jednotlivými zákazníky a podpořit obrat u prodejců.
Jak z dat získat užitečné informace?
Z hlediska plánovaného projektu je zajímavé sledovat:
1. Které komponenty jednotliví odběratelé za sledované období nakoupili?
2. V jakém pořadí se nákupy uskutečnily?
K nalezení skrytých vzorů v datech, které popisují chování zákazníků, použijeme analýzu sekvencí a asociací. Výsledkem analýzy budou pravidla tvaru KDYŽ podmínka PAK následek. (V angličtině se používá označení IF body THEN had.) Pravidla jsou určována na základě četností, s jakými se podmínka a následek vyskytují v datech. Díky této analýze dokážeme efektivně odpovědět na otázky typu: Které produkty je dobré zákazníkovi nabízet současně? Když zákazník koupil zboží A, který další produkt je vhodné mu nabídnout?
Vlastní analýza
Na data můžeme pohlížet sekvenčně, či nesekvenčně. Podívejme se nejprve na nesekvenční přístup. V tomto případě se nejedná o klasický „nákupní košík“, kdy zákazník nakoupí více druhů zboží najednou. Vzhledem k plánovanému záměru managementu budeme za jeden „nákupní koš“ považovat nákupy jednoho zákazníka za půl roku. Výsledkem analýzy mohou být asociační pravidla uvedená v tabulce 2. Z výsledků je například patrné, že zákazník si s 16% pravděpodobností současně koupí zboží s ID 1172 a 2372. Pokud si zákazník koupí zboží s ID 2272 a 2972, je 60% pravděpodobnost, že koupí také produkt s ID 2372.

Tab. 2: Asociační pravidla
Prohlédněme si některá asociační pravidla v grafické podobě na obrázku 1. Vidíme například, že se často společně kupují komponenty s ID 2372 a 1172, a komponenty s ID 2372 a 2272. Pokud zákazník koupí komponentu s ID 1172, je velká pravděpodobnost, že pořídí také produkt s ID 2372 (nákup v obráceném sledu je méně pravděpodobný).

Obr. 1: Grafické znázornění vybraných asociačních pravidel - rule graph
Také další graf přehledně popisuje některé vybrané asociace – viz obrázek 2. „Web graph“ navíc ukazuje, že nejžádanější je náhradní díl s ID 2372 nebo například že se častěji kupují náhradní díly s ID 2372 a 2273 dohromady než zvlášť (lift = 1,2 viz tabulka 2).

Obr. 2: Grafické znázornění vybraných asociačních pravidel - web graph
Nyní se podívejme na data sekvenčně. Zohledníme tedy pořadí, v jakém jednotliví zákazníci zboží v rámci sledovaného období nakupovali. Výsledkem mohou být sekvenční pravidla uvedená v tabulce 3. Již víme, že komponenta s ID 2372 je nejžádanějším náhradním dílem. Ze sekvenční analýzy navíc vyplývá, že pokud již zákazník komponentu s ID 2372 koupil, objedná další stejný díl s 32% pravděpodobností. Vybraná sekvenční pravidla jsou graficky znázorněna na následujícím obrázku 3.

Tab. 3: Sekvenční pravidla
Můžeme si například všimnout poměrně vysoké pravděpodobnosti (37%), že zákazník, který koupil komponentu s ID 3174, koupí následně také náhradní díl s ID 2372.

Obr. 3: Grafické znázornění vybraných asociačních pravidel - rule graph
Závěr
Uvedené postupy ukazují cestu, jak odhalit zajímavé vzorce chování zákazníků. Nyní dokážeme popsat, které komponenty jednotliví odběratelé za sledované období nakoupili a v jakém pořadí se nákupy uskutečnily. Abychom tato pravidla mohli použít jako podklad pro tvorbu strategie produktového managementu, je samozřejmě nutné dobře znát věcnou povahu dat. Nalezení významných rysů v chování stávajících zákazníků pak může výrazně přispět například k tvorbě dobrých predikcí chování nových zákazníků nebo ke zvýšení efektivity marketingových kampaní.
Petra Beranová
Autorka působí jako senior consultant
ve společnosti StatSoft CR


![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 1 | 2 | 3 | 4 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
Formulář pro přidání akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |