www.systemonline.cz

Hlavní partner sekce

Tematické sekce

ERP systémy

CRM systémy

Plánování a řízení výroby

AI a Business Intelligence

DMS/ECM - Správa dokumentů

HRM/HCM - Řízení lidských zdrojů

EAM/CMMS - Správa majetku a údržby

Účetní a ekonomické systémy

ITSM (ITIL) - Řízení IT

Cloud a virtualizace IT

IT Security

Logistika, řízení skladů, WMS

IT právo

GIS - geografické informační systémy

Projektové řízení

Trendy ICT

E-commerce B2B/B2C

CAD/CAM/CAE/PLM/3D tisk

Branžové sekce

Automobilový průmysl

Banky a finanční organizace

Energetika a utility

Potravinářský průmysl

Stavebnictví - BIM, CAFM

Veřejný sektor a zdravotnictví

SystemNEWS



Přihlaste se k odběru newsletteru SystemNEWS, který každý týden přináší výběr článků z oblasti podnikové informatiky

Archiv SystemNEWS

Přehledy

Přehledy IS
APS (20)
BPM - procesní řízení (22)
Cloud computing (IaaS) (10)
Cloud computing (SaaS) (33)
CRM (51)
DMS/ECM - správa dokumentů (20)
EAM (17)
Ekonomické systémy (68)
ERP (77)
HRM (27)
ITSM (6)
MES (32)
Řízení výroby (37)
WMS (31)
Dodavatelé IT služeb a řešení
Datová centra (25)
Dodavatelé CAD/CAM/PLM/BIM... (39)
Dodavatelé CRM (33)
Dodavatelé DW-BI (50)
Dodavatelé ERP (71)
Informační bezpečnost (50)
IT řešení pro logistiku (45)
IT řešení pro stavebnictví (25)
Řešení pro veřejný a státní sektor (27)

Inzerce

Partneři webu

Best WordPress Themes

Hlavní strana -> Časopis IT Systems -> Rok 2011 -> IT Systems 6/2011 -> Data mining (nejen) v energetice

IT SYSTEMS 6/2011 , AI a Business Intelligence

Data mining (nejen) v energetice

Rostoucí objemy dat a informací o zákaznících představují v energetických organizacích obrovský potenciál pro obchodní a strategické využití. Pro naplnění cílů a výzev je správné rozhodnutí hlavním mezníkem mezi úspěchem a neúspěchem. Co potřebujeme k takovémuto rozhodnutí? Informace? Ano, ale jak získat ty správné informace, jež nám zaručí úspěch? Právě k tomu nám slouží data mining, tedy proces shromažďování a vyhodnocování dat pro získání optimálního rozhodnutí.

Nastupující silná konkurence předpokládá využití všech marketingových zdrojů. Databáze, datové sklady, operativní a neustále upravované proudy dat jsou v tomto směru tou nejvyšší hodnotou. Je v nich informace, kterou je třeba vydolovat a převést do tvaru použitelného pro rutinní rozhodování i pro jednotlivá ad hoc rozhodnutí. Marketing je jednou z oblastí, kde má tento přístup již dlouhou tradici v jiných oborech a lze předpokládat, že se v široké míře dostane i do oblasti utilit. Přístup k zákazníkům je různý, buď se útočí zeširoka, nebo se využívá cíleného marketingu a různých cross/up-sell nabídek. Otevřením trhu se energetičtí giganti dostali do stejné situace, v jaké před nimi byly telekomunikační a bankovní společnosti, a tak i oni postupně objevují užitečnost data miningu. Nyní tyto společnosti potřebují řešit základní úlohy, jako jsou behaviorální segmentace zákazníků a spotřebitelů, a odhalit ty zákazníky, kteří inklinují k odchodu ke konkurenci, inklinují k podvodnému chování. Potřebují umět efektivně takové případy vyřešit, nebo jim preventivně zamezit.

Od čistých dat k celému modelu

Data miningový proces by měl mít svoji metodologii, která zaručí, že nic podstatného nebude opomenuto a vše bude správně zdokumentováno. Takovou metodologií může být například softwarově nezávislá metodologie CRISP-DM, vyvinutá konsorciem firem z různých z prostředků EU. CRISP-DM je veřejně dostupná metodologie pomáhající celý dataminingový proces spolehlivě a opakovaně realizovat. Metodologie je relativně pružná vzhledem ke specifickým požadavkům různých úloh a je zaměřena na věcné problémy rozhodování. Velké dataminingové projekty člení na etapy a v rámci etap provádí další jemnější členění.
Metodologie říká, že nejprve je nutno problém dobře pochopit, abychom měli představu o tom, jaká data vlastně potřebujeme a pak kde a jak jsou uložena. Víme-li, co potřebujeme, musíme to v rámci přípravy dat získat, tedy data načíst a provést s nimi různé datové manipulace a transformace. Cílem je vytvořit modelovací matici pro vybranou úlohu, nad kterou hledáme takový model, který by data charakterizoval nejlépe, nejrychleji, nejjednodušeji, zkrátka tak, jak si určíme. Ve fázi evaluace je potřeba model ověřit nad novými daty. Po evaluaci modelu je model nasazen do produkčního prostředí.

Modelová úloha z praxe

Pokusme se nyní demonstrovat použití data miningu na příkladu velké energetické společnosti, která chce řešit několik úloh. Marketingové oddělení společnosti se snaží oslovit a získat nové zákazníky. Většinou začne u svých zákazníků a nabídne jim další produkt. Pokud zákazníkovi již prodává plyn, zkusí mu nabídnout i elektřinu, a naopak. Bude tedy vycházet z analýzy současných i nových zákazníků, vybere si „cenné“ a „bezproblémové“ zákazníky s dobrou platební morálkou a pokusí se najít takové vzory chování, které by naznačovaly potenciál k cross-sell nabídkám. Druhou úlohou mohou být predikce očekávané spotřeby. Ta je důležitá z hlediska řízení a správy přenosové soustavy. Oddělení rizik naopak hledá potenciální podvody, machinace s fakturami, odečty apod. Příkladem může být hlášení nižších odečtů před plánovaným zdražováním.
Pro tento článek jsme si však vybrali úlohu predikce odchodu zákazníků ke konkurenci. K dispozici máme celou řadu datových zdrojů obsahujících informace o zákaznících, firmách i domácnostech, smluvních účtech a smlouvách. Data jsou z různých zdrojů, v různých formátech a různého charakteru – statická a transakční. Prvním problémem tedy je konsolidace datové základny. Zde je potřeba vyvrátit jeden mýtus o data miningu, a to že představuje pouze modelování a modelovací algoritmy. Ano, data mining může být modelování, ačkoli celá řada úloh žádné modelovací algoritmy nepotřebuje, ale hlavně je to práce s daty, pak práce s daty a nakonec ještě trochu práce s daty.
Příprava dat v praxi činní i osmdesát procent času řešení úlohy. Pro naši úlohu tedy potřebujeme takový nástroj, který tuto dobu zkrátí na minimum, a to tak, že načte data z databází různých typů, textových souborů různých formátů v rozsahu milionů záznamů a desítek či stovek proměnných, provede příslušné konverze typů proměnných a další datové transformace tak, aby data mohla být spojena v jeden konzistentní celek.

Spojením zákaznických a transakčních dat může vzniknout datová základna třeba s padesáti miliony případy obsahujících spotřeby různých zákazníků za různá období. To vše se pak musí pomocí restrukturalizace a agregace přetransformovat tak, aby jeden řádek odpovídal jednomu zákazníkovi. Poté se z celé řady proměnných a vzájemných kombinací proměnných vytváří nové odvozené proměnné a generují se nové příznakové, stavové, proměnné (tzv. flag), které nám pomohou v dalším modelovacím procesu. O každém zákazníkovi chceme znát informace o jeho spotřebě, platební morálce, sociodemografických charakteristikách, ideálně i nějaké historické údaje, informace ze zákaznických call-center zpracované pomocí textminingu, i další například tržní informace z dané oblasti.

Data mining přináší novou formu informací, jež slouží jako podpora pro rozhodování a která v kombinaci s dobrým marketingovým myšlením utváří tu správnou cestu k úspěchu.

Modelování

K modelování naší úlohy, kdy chceme identifikovat zákazníky, kteří chtějí odejít ke konkurenci, je potřeba jistá historická znalost. Námi hledaný model se musí naučit identifikovat ty proměnné, které jsou z pohledu odchodu zákazníka ke konkurenci nejvýznamnější, na základě historických případů zákazníků, kteří již skutečně odešli. Jinými slovy existuje jedna cílová proměnná, která nabývá hodnot odešel/neodešel a celá množina různě významných prediktorů. Těmi mohou být číselné proměnné, ordinální i nominální proměnné a celá řada v předchozí fázi vytvořených stavových (flag, příznakových) proměnných.
Naším cílem je najít přiměřený počet prediktorů nejlépe popisující cílovou proměnnou. Jednoduchost modelu je často vyžadována z důvodů optimalizace, implementace a aktualizace. Proces v této fázi končí nasazením do praxe, tzv. skórováním zákazníků, vyjádřením jejich potenciálu k odchodu ke konkurenci. Výsledkem je předpovídaný stav a pravděpodobnost vyjadřující míru jistoty modelu.

Data mining je konkurenční výhodou

Samotné skórování zákazníků je pouze první krok. Víme-li, který zákazník odejde, aktivujeme proces, který se pokusí zabránit zákazníkovi v přechodu ke konkurenci. Podle hodnoty zákazníka spustíme jeho „záchranu“. Otestujeme účinnou retenční kampaň, vybereme vhodný komunikační kanál a zákazníkovi hodíme záchranný kruh.
Energetické společnosti se v současné době neustále předhánějí s různými nabídkami, které mají za úkol zákazníka udržet či „přetáhnout“ od konkurence. Jedná se o různé dárky, nabídky fixace ceny, slevová zvýhodnění, slevy za on-line komunikaci, výhodnější energetické poradenství apod. Platným pravidlem totiž je, že je jednodušší a levnější si zákazníka udržet než získat nového. Vyhrává ten, kdo si toto uvědomí co nejdříve.
Data mining je již mnoho let v oblasti obchodních společností, bankovnictví a telekomunikací celosvětovým fenoménem, a pokud je kvalitní nástroj doplněn o dobrou myšlenku, je využití potenciálu ze skrytých informací v datech zaručeno.

Libor Šlik
Autor je konzultantem a analytikem společnosti SPSS CR.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Konec pálení tokenů, trh tlačí na návratnost

BIQ Group spouští AI hub a jeho tým letos rozšíří na dvojnásobek

Slabý datový základ je příčinou pomalého růstu a nízké efektivity firem, a to navzdory implementaci AI. To má zásadní vliv i na návratnost AI projektů, podle studie State of AI in Business od MIT jich přitom selže až 95 %. Technologická skupina BIQ Group reaguje na tento stav spuštěním AI hubu, který pomáhá stavět datový základ a zavádět umělou inteligenci napříč organizací. K tomu využívá zaběhnuté ekosystémy Microsoft, SAP, Kentico či Atlassian. Tým nyní čítá 11 lidí a letos plánuje vyrůst na dvojnásobek. Aktuálně se podílí na projektech pro společnosti DPD SK, Veacom či GTS Alive.

» Více

Časopis IT Systems / Odborná příloha

Více o časopisu IT Systems

Archiv časopisu IT Systems

Oborové a tematické přílohy

Kalendář akcí

červenec - 2026
Po	Út	St	Čt	Pá	So	Ne
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31	1	2
3	4	5	6	7	8	9

IT Systems podporuje

6.10.

Unicorn Banking Forum 2016

Formulář pro přidání akce

Další vybrané akce

17.8.	VMware vSphere: Install, Configure, Manage [V8]
1.9.	F5 Administering BIG-IP v.17.5
7.9.	Microsoft Azure Administrator: AZ-104
14.9.	Veeam Backup & Replication: Configure, Manage and...
14.9.	Citrix NetScaler ADC 14.x Administration
21.9.	VMware NSX: Install, Configure, Manage [V4.0]
22.9.	Check Point Certified Security Administrator (CCSA)...
30.9.	Konference Světlo

Další akce