facebook LinkedIN LinkedIN - follow
PříLOHA #1 3/2003

Data mining v praxi

Zkušenosti z projektů realizovaných v ČR společností Adastra

Martin Šály





Podle dostupných informací realizovala společnost Adastra v minulém roce v ČR největší počet komerčně realizovaných data mining projektů. Typický projekt byl realizován na klíč, počínaje spoluprací na definici obchodního problému přes data mining modelování až k realizaci zprovoznění modelů ve formě skórování zákazníků. Zkušenosti, které byly z jednotlivých projektů získány, nemůžeme a nechceme zevšeobecňovat na celou oblast komerčních data mining projektů v ČR, nicméně domníváme se, že mohou být zajímavé, a proto je uvádíme v následujícím heslovitém přehledu:

Zákazníci
Jednalo se o společnosti z oblasti bankovnictví, telekomunikací a pojišťovnictví. Sponzory projektů byli pracovníci z oblasti marketingu (typicky marketingoví analytici) nebo vedoucí pracovníci informatiky.
Obchodní oblasti
Hlavními řešenými úlohami byla segmentace zákazníků, analýza a predikce odchodu zákazníků ke konkurenci, analýza rizik pro stanovení pojistných sazeb.

Motivace zákazníků k data mining projektům
Základní motivací pro zákazníky byla skutečnost, že v určitých obchodních oblastech v ČR začíná výrazně sílit boj o zákazníka a zvyšuje se migrace zákazníků. Dalším podnětem pro data miningové projekty byl zájem zahraničních mateřských společností implementovat ve svých dceřinných firmách v ČR metody, které již v jiných zemích využívají a mají s nimi zkušenosti.

Přístup zákazníků
Cílem zákazníků bylo realizovat pilotní projekt, který by znamenal jednak konkrétní obchodní přínos, nicméně současně ilustroval možnosti data miningu jako celku. Pro pilotní projekt typicky zákazník nepředpokládal zakoupení nebo pronájem žádné technologie. U některých projektů bylo jejich součástí koučování interních pracovníků zákazníka.


Ukázka analytického prostředí (rozhodovací strom) v software Angoss Knowledge Studio.

Délka projektů
Projekty trvaly 2-4 kalendářní měsíce. Jednalo se spíše o relativně cílené projekty, které připravovaly půdu budoucím projektům analytického CRM s rozsáhlejším skórovacím systémem.

Příprava dat
Příprava se realizovala typicky s využitím SQL (PL/SQL a T-SQL) a rovněž MS DTS. Data byla profilována s využitím běžných statistických technik (korelační, faktorová analýza atd.) a normalizována buď s využitím těchto nástrojů nebo pomocí námi vyvinutých SQL normalizačních a skórovacích šablon.

Technologie
Relevantní data mining projekty jsme realizovali s analytickými technologiemi společnosti SPSS (Clementine, SPSS Base + moduly, Answer Tree) a Angoss Knowledge Studio.

Modelovací metody
Ve výsledných modelech se uplatnily metody: K-means, Kohonenova síť a Two Step pro shlukování, rozhodovací stromy (CHAID, CART a C5.0) a MLP umělé neuronové sítě pro klasifikační a prediční úlohy, Apriori a C 5.0 pro hledání klasifikačních pravidel. Byly rovněž testovány další modely jako logistická regrese, ale v daných konkrétních případech se neuplatnily.

Způsoby zprovoznění modelů
V projektech, jejichž součástí bylo zprovoznění modelů skórování zákazníků, byly využity buď generické vlastnosti daného nástroje pro zprovoznění (konkrétně Clementine) nebo naše vlastní SQL skórovací šablony.

Obchodní přínosy pro zákazníky
V konkrétním případě analýzy a predikce odchodu zákazníků u telekomunikační společnosti se potvrdily odhady uváděné v zahraničních pramenech, které hovořily o reálné možnosti snížit objem ztráty tržeb od odcházejících zákazníků o více než 10%. Na základě tohoto bylo a je možné relativně přesně zjišťovat ROI data mining projektu analýzy a predikce odchodu zákazníků.

Segmentace zákazníků přinášely jednak první pohledy na strukturu zákazníků a dále ve spojení s dodatečnými pravidly umožnily vygenerovat sadu procesních obchodních pravidel typu "Zákazník ze segmentu A s revenue vyšším než X Kč a délkou smluvního vztahu vyšší než Y: nabídnout produkt Z".
Analýza rizik v pojišťovnictví umožnila optimalizovat pojistné sazby.

Hlavní obtíže
Hodnotu projektů snižovalo zejména neporozumění možnostem obchodního uplatnění výsledků data miningu ("Naše zákazníky známe") a malá podpora obchodně zodpovědných manažerů, tedy nedůsledné dotahování zjištěných výsledků do úrovně obchodních procesů.
Časté byly obtíže se získáváním dat a kvalitou datových zdrojů - data miningové projekty se realizují jednodušeji tam, kde již je funkční a stabilní prostředí datového skladu

Pozn. red.: Autor článku, Martin Šály, působí jako Data Mining specialista ve společnosti Adastra.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Fortinet představil první bezpečné síťové řešení s podporou Wi-Fi 7

FortiAP 441KNový přístupový bod Wi-Fi 7 a 10gigabitový switch s podporou napájení PoE nabízí 2x vyšší rychlost a zvýšenou kapacitu v rámci integrovaného portfolia bezpečných pevných a bez­drá­to­vých řešení společnosti Fortinet.