facebook LinkedIN LinkedIN - follow
IT SYSTEM 9/2000

IRIS Explorer: Visual Data Mining

Milan Vinter





Metody Data Mining systémů jsou nejčastěji postaveny na relaci statistických pracovních postupů, nervových sítí nebo genetických algoritmů. Výsledky těchto metod poskytují nezřídka komplexní a více-rozměrné řešení, ale také často mnoho datových množin postrádajících možnost vlastního srozumitelného zobrazení.

A právě oblast vizualizace analyzovaných dat pokrývá software IRIS Explorer. Jedná se o nástroj ze skupiny Visual Data Mining, který uživateli dovoluje analyzovat a zobrazit jeho data a pokusí se mu pomoci najít i vhodné řešení jeho problému.

Marketingový výzkum
Dobrým příkladem oblasti, kde znalosti a pochopení věci jsou na prvním místě je oblast marketingového výzkumu. Krátká doba na oslovení trhu a rychle se měnící požadavky zákazníků, to jsou faktory, které vedou k nutnosti rychlého rozhodování.

Ukažme si aplikaci vizualizačních metod se statistickými analyzačními metodami pro rozsáhlé marketingové výběry informací na příkladě aktivit banky Dutch Financial Asset Management Company.

Hlavním záměrem bylo využití dat k nastartování komunikace s velmi rozsáhlou populací klientů. Speciálně bylo třeba zajistit, aby marketing určitých finančních produktů byl nasměrován na klienty s vysokým stupněm zájmu - cílovou skupinu, tedy ty, kdo by finanční produkty nejpravděpodobněji koupil. Marketingové údaje byly zčásti získány z databáze zákazníků a částečně z dotazníků od zákazníků.

Datový soubor obsahoval data od 25 000 zákazníků, kde každý z nich byl popsán hodnotami s více jak 100 proměnnými (jako např. věk, příjem, harmonogram dřívějších investic apod.). K přesnějšímu určení míry vhodnosti pro zařazení do cílové skupiny byl zjišťován stupeň korelace mezi danými hodnotami a ostatními údaji (jako např. věkem). Adekvátně pak byla zkonstruována i korelační matice pro všechny hodnoty od všech 25 000 zákazníků.

Korelační matice byla načtena do mapy systému IRIS Explorer, kde byl použit modul Graph3D k zobrazení údajů ve 3D histogramu. Korelace v datovém souboru se zobrazily jako "sloupky" v histogramu - čím vyšší sloupec, tím silnější korelace. Sloupky napříč po diagonále jsou automatickou korelací jednotlivých hodnot. Výsledkem bylo například zjištění a matematické potvrzení, že stupeň zájmu se u klienta silně projevuje s jeho věkem. Dalším poznatkem bylo to, že uživatel interaktivně vybíral silně korelující párové hodnoty.

Systém rovněž dovoluje určit nejen vzájemnou korelaci mezi klienty a produkty (na to by stačily "obyčejné" statistické programy), ale každý vstupní údaj (tj. klienta banky) lze zařadit do skupiny o společných znacích, tak jak to vidíme na obrázku 2. Marketingoví pracovníci pak mohou pracovat s již jasně definovanou skupinou klientů, kterým mohou nabídnout služby, které nejlépe odpovídají jejím předpokladům a požadavkům.

Vedle zobrazení ve vícerozměrném grafu, dovoluje program IRIS Explorer rozvinout data do "plochy", kdy slupce o společných znacích (definované určitou podmínkou) jsou barevně označeny a odlišeny od okolí. Síla korelace vlastností se projevuje jejich navýšením.

Zhodnocení projektu
Využitím 3D korelace lze identifikovat důležité charakteristiky dat uživatele a použít je pro identifikaci cíloví skupiny marketingového snažení. Při výběru vysoce korelujících hodnot se lze zaměřit na rozdělení dat a vybrat vhodný rozsah dat pro analyzovanou skupinu.

Na příkladu produktů banky se kromě jiného prokázalo, že se metody vizualizace, nabízené softwarem IRIS Explorer, ukazují jako další nástroj pro výzkum trhu, který dovolují přesněji určit budoucí komunikaci na uživatelském základě.

K článku bylo použito literatury:
Anton Heijs, MINT b.v. and Ruud Smeulders, Robeco Group.
Podklady společnosti The Numerical Algorithms Group Ltd, Oxford UK.


OPENCAE Praha s.r.o.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Modernizace IS je příležitost přehodnotit způsob práce

IT Systems 4/2025V aktuálním vydání IT Systems bych chtěl upozornit především na přílohu věnovanou kybernetické bezpečnosti. Jde o problematiku, které se věnujeme prakticky v každém vydání. Neustále se totiž vyvíjí a rozšiřuje. Tematická příloha Cyber Security je příležitostí podívat se podrobněji, jakým kybernetickým hrozbám dnes musíme čelit a jak se před nimi můžeme chránit. Kromě kybernetické bezpečnosti jsme se zaměřili také na digitalizaci průmyslu.