facebook
Tematické sekce
 
Branžové sekce
Přehledy
 
Tematické seriály
 

GDPR

General Data Protection Regulation zásadně mění zpracování osobních údajů a zavádí nové povinnosti...

články >>

 

Jak uřídit IT projekt a nezbláznit se

Užitečné tipy a nástroje pro řešení problémů řízení inovací a vývoje produktů...

články >>

 

Industry 4.0

Průmysl 4.0

Jaký vliv bude mít čtvrtá průmyslová revoluce na výrobu a výrobní firmy?

články >>

 

Komplexní svět eIDAS

O nařízení eIDAS již bylo mnoho řečeno i napsáno. A proto jediné, o čem...

články >>

 

Trendy v CRM

Systémy pro řízení vztahů se zákazníky (CRM) prochází v posledních letech výraznou změnou. Zatímco dříve...

články >>

 

Příručka úspěšného IT manažera

Dnes je řada IT manažerů opomíjena. Úspěšní bývají brouci Pytlíci a Ferdové...

články >>

 
Partneři webu
AEC
Data Warehousing , AI a Business Intelligence

Data mining – přeměna dat v hodnotné informace

Pavel Pilař


Každá firma, která provozuje informační systémy, vlastní více či méně rozsáhlou databázi údajů, které obvykle ne zcela využívá. Data mining je proces získávání znalostí, vztahů a dříve neznámých informací z dostupných dat. Pod tímto pojmem se skrývá mnoho různorodých technik a postupů, jimiž jsou vstupní „surová“ data upravována, čištěna a analyzována. Díky nesporným přínosům data miningu, zejména pro obchodní procesy, roste obliba tohoto druhu úloh a četnost jejich nasazení. Informace získané prostředky data miningu lze začlenit do stávající IT infrastruktury a zpřístupnit je podle potřeby pracovníkům na všech úrovních organizační struktury společnosti (například managementu, pracovníkům call centra, pracovníkům, kteří vyřizují žádosti o úvěr, apod.).


Ve stručnosti zmíníme alespoň několik nejvýznamnějších oblastí, kde se data mining s úspěchem využívá.

Marketing

Odhad pravděpodobnosti daného chování zákazníka. Pro optimální zacílení přímé reklamní kampaně je nesmírně cenná znalost pravděpodobnosti, s níž daný zákazník zareaguje pozitivně na konkrétní nabídku. Metodami data miningu lze tuto pravděpodobnost odhadnout na základě dostupných dat o průběhu předchozích srovnatelných kampaní. Se znalostí této informace lze snížit náklady na cílenou reklamní kampaň o desítky procent při zachování její účinnosti.
Segmentace zákazníků. V řadě velkých firem platí, že 90 % obratu firmy tvoří 10 % nejvýznamnějších zákazníků. Tuto základní formu segmentace na základě vybraných parametrů (v tomto případě výše obratu) umožňuje už většina analytických nástrojů. Segmentace metodami data miningu umožní nalézt a identifikovat segmenty napříč desítkami atributů zákaznické databáze. Marketingová práce s jednotlivými dílčími segmenty je pak podstatně efektivnější než práce s kompletní zákaznickou databází.
Analýza nákupního koše. Identifikace spotřebního chování. Z dat o prodejích, jako jsou záznamy z prodejních terminálů nebo web logy internetových obchodů lze odvodit informace o nákupním chování zákazníků. Znalost těchto informací napomáhá efektivněji uspořádat obchod či katalog – ať už fyzický, nebo elektronický.


Vyhodnocení pravděpodobnosti chování zákazníků


Churn management

Odhalení potenciálního přechodu zákazníka ke konkurenci. Na základě analýzy dřívějšího chování zákazníků, kteří v minulosti přešli ke konkurenci, lze odvodit modely chování, které přechodu ke konkurenci předcházejí. Náklady na udržení stávajícího zákazníka jsou podstatně nižší než náklady na získání zákazníka nového. Na zákazníka, u něhož jsou identifikovány tyto typické vzory chování, lze pak cíleně působit tak, aby se potenciálnímu přechodu ke konkurenci předešlo.

Risk management, fraud detection

Odhad kreditního rizika. Odhad rizika opoždění plateb. Analýzou historických dat lze vytvořit modely, které identifikují potenciálně rizikový úvěr a míru tohoto rizika na základě demografických údajů a dalších dostupných informací.

Identifikace „potenciálního podvodníka“. Na základě analýzy chování zákazníků, u nichž byl zjištěn podvod nebo pokus o něj, lze odvodit modely pro chování takového zákazníka. Aplikací vytvořeného modelu na dostupná data lze identifikovat potenciální podvod.

Řízení výroby, management jakosti

Analýzou dat z průběhu automatizované výroby a jejich odchylek lze identifikovat problematické výrobní kroky, ať už z hlediska jakosti nebo z hlediska dodržení tempa výroby. Na základě takto zjištěných informací lze například do výrobního procesu doplnit dodatečnou kontrolu, která již v průběhu výroby odhalí rozpracované výrobky, které by po dokončení neprošly výstupní kontrolou.

Proces data miningu

Proces data miningu, jak je v současné době využíván většinou firem, lze rozdělit do následujících fází:
  • Definice problému – prvním krokem v procesu je jasná definice problému z obchodního hlediska. Úspěšný data mining je vždy zahájen dobře definovaným projektem, musí být zřejmý zadavatel úlohy a její cíl.
  • Redefinice cíle v terminologii dostupných dat – je třeba určit datové zdroje pro data nutná ke splnění zadání.
  • Příprava dat – je obvykle nejzdlouhavější částí každého dataminingového projektu. Tato fáze v sobě zahrnuje konsolidaci dat z datových zdrojů, čištění dat a jejich přípravu do struktury vhodné pro data mining. Tato fáze je nesmírně důležitá pro celkový úspěch projektu – výsledné modely jsou tak dobré, jak dobrá jsou data použitá pro jejich vytvoření.
  • Volba a tvorba modelu – tato fáze zahrnuje volbu a následné využití převážně statistických nástrojů pro vytvoření a parametrizaci matematických modelů. Použitý model se volí dle cíle dataminingového projektu. Na základě vstupních dat se optimalizují parametry tak, aby model co nejlépe predikoval chování u neznámých dat.

Začlenění data miningu do IT struktury

Postup začlenění dataminingového řešení do informační struktury podniku je závislý na dodavateli konkrétní technologie. V každém případě lze říci, že je vhodnější provádět data mining nad existujícím datovým skladem. Je-li data mining prováděn nad daty v primárních systémech, výrazně se tím komplikuje a prodlužuje fáze přípravy a čištění dat.
Technická architektura pro data mining je specifická pro jednotlivé dodavatele dataminingových řešení. Lze rozlišit dva základní modely architektury:
Oddělený dataminingový server – v tomto uspořádání je dataminingový server fyzicky i technologicky oddělen od ostatních serverů společnost. Před vlastním zpracováním dat na dataminingovém serveru je třeba všechna zpracovávaná data načíst na tento server.
Integrovaný dataminingový server – v tomto uspořádání je dataminingový server technologicky integrován do jednoho prostředí s datovým skladem, serverem pro OLAP analýzy a případně i s částí primárních systémů. Zjednodušuje se tím správa dataminingového serveru i zajištění načítacích procesů. Tato varianta ale poněkud zužuje výběr možných dodavatelů řešení. Prezentační vrstva dataminingového řešení obvykle zahrnuje různé varianty doručení informací – produktů data miningu cílovému uživateli. Zobrazení těchto informací může být začleněno do provozních systémů. Uživatel má tak kromě informací o dřívějším nákupním chování zákazníka k dispozici například i predikci jeho dalšího nákupního chování. Jinou formou prezentace mohou být pravidelné reporty, například potenciálně problematických smluv či zákazníků. Další využití těchto informací je již dáno standardními vnitrofiremními procesy.

Současnost a budoucnost data miningu

Ze současného stavu a vývoje dataminingových řešení lze vysledovat několik významných trendů do budoucna: Rozšiřování - stejně jako u datových skladů v nedávné době je patrné neustálé rozšiřování skupiny společností, které používají dataminingové postupy. Za tím stojí jednoznačně fakt, že efektivní využití získaných dat představuje pro firmy nemalou konkurenční výhodu. Průběžně také zlevňují technické prostředky pro data mining. Lze tedy očekávat, že si dataminingová řešení postupně budou nacházet cestu do stále menších společností.
Prohlubování - je obvyklé vyzkoušet technologii pro data mining v rámci firmy na jednodušším, pilotním projektu. U firem, které již dataminingová řešení zavedly, se obvykle řešení rozšiřuje o další oblasti.
Objevování nových směrů - po prosazení data miningu v marketingu, bankovnictví, telekomunikacích a dalších oborech lze pozorovat postupné pronikání dataminingových technologií i do dalších oblastí. Za zmínku zde stojí například využití v medicíně, biochemii, genetice a jiných oborech. Autor článku působí ve společnosti SophiaSolutions.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Časopis IT Systems / Odborná příloha Archiv časopisu IT Systems
IT Systems 6/
IT Systems 5/
IT Systems 4/
IT Systems 3/
Oborové a tematické přílohy
příloha #1 6/
příloha #1 5/
příloha #1 4/
příloha #1 3/
IT Systems - předplatné
Kalendář akcí