facebook
Tematické sekce
 
Branžové sekce
Přehledy
 
Tematické seriály
 

GDPR

General Data Protection Regulation zásadně mění zpracování osobních údajů a zavádí nové povinnosti...

články >>

 

Jak uřídit IT projekt a nezbláznit se

Užitečné tipy a nástroje pro řešení problémů řízení inovací a vývoje produktů...

články >>

 

Industry 4.0

Průmysl 4.0

Jaký vliv bude mít čtvrtá průmyslová revoluce na výrobu a výrobní firmy?

články >>

 

Komplexní svět eIDAS

O nařízení eIDAS již bylo mnoho řečeno i napsáno. A proto jediné, o čem...

články >>

 

Trendy v CRM

Systémy pro řízení vztahů se zákazníky (CRM) prochází v posledních letech výraznou změnou. Zatímco dříve...

články >>

 

Příručka úspěšného IT manažera

Dnes je řada IT manažerů opomíjena. Úspěšní bývají brouci Pytlíci a Ferdové...

články >>

 
Partneři webu
Dialog 3000Skylla
IT SYSTEMS 11/2019 , AI a Business Intelligence

Bohatství, které zůstává ladem

Dominik Matula


ProfinitZkusili jste se někdy ponořit do hlubin datového skladu vaší společnosti? Možná jste tam krom nějakého toho kostlivce našli zlatou žílu. A pokud ne, je nejvyšší čas vyhrnout si rukávy a začít těžit data!


O tom, jak esenciálně důležité je hledat, těžit a sofistikovaně využívat informace, nás dennodenně přesvědčují internetoví giganti dneška – Amazon, Google, Facebook a další. Všechny tyto firmy dokáží zpracovat informace o svých klientech a přetavit je v zisk pro sebe a v kvalitnější služby pro své uživatele. Vždyť kdo z nás nikdy neklikl na další video, které by se vám mohlo líbit? A kdo z nás nikdy nepřihodil do košíku ještě jednu knihu, kterou lidé jako vy také koupili?

Obrovský potenciál mají především relační data. Všimněte si, že všechny zmíněné korporace těží právě z tohoto druh dat! Naštěstí nemusíte provozovat zrovna největší e-shop světa, abyste je mohli využít. Relační data ukládá většina našich klientů (banky, telko, státní instituce, …). Jde jen o to vytěžit z nich maximum.

Transakční obraz klienta

Pojďme se v krátkosti podívat na příklad využití Installment Detectoru, který jsme vyvinuli pro jednu českou banku. Jeho cíl byl jednoduchý – mám klienta, kterému vedeme běžný bankovní účet, a chtěli bychom zjistit, zda (a které!!) jeho transakce jsou splátkami. Jistě si sami dokážete představit, co by to mohlo přinést! Jen namátkou:

  • Z výše splátek a jejich (ne)pravidelnosti si dokážu udělat lepší představu o rizikovosti klienta.
  • Mohu mu připravit nabídku na míru a nabídnout mu lepší podmínky. Spokojený pak bude váš zákazník i váš management.

Abychom zjistili, které transakce jsou splátkami, naštěstí nemusíme své klienty obvolávat. Stačí se pečlivě podívat do dat, která už stejně mám v datových skladech uložená.

Jmenuji se Holmes. Sherlock Holmes.

Jak takové hledání pokladů v datech probíhá? Spíš než data mining, jak se této činnosti zpravidla říká, mi celý proces připomíná důkladnou detektivní práci. Nevěříte? Sledujte se mnou:

Na začátku detektiv pečlivě zkoumá místo činu, diskutuje se svědky a vytváří si několik vyšetřovacích hypotéz. Podobně musí data scientist pečlivě studovat celou problematiku, tedy svět půjček a splátkových společností, typické chování klientů v jednotlivých segmentech, anomálie v transakčních vzorech atd.. Velmi přínosná je diskuse s doménovými odborníky našeho klienta - to oni jsou těmi svědky, kteří znají data i proces jejich vzniku.

S každou stopou, kterou detektiv najde, upravuje svoje přesvědčení o tom, co se na místě činu skutečně stalo. Pokud se kupříkladu v nedalekém zahradním domku najdou zakrvácené vidle, podezření na zahradníka okamžitě vzroste. Bohužel ne vždy jsou stopy takto jasné – někdy je třeba rozplétat předivo událostí s Holmesovskou pečlivostí a smyslem pro detail.

V našem případě jsme naučili digitálního detektiva všímat si nejen očividných stop (např. na známý účet splátkové společnosti jde platba s poznámkou „splátka televize“). Aby si obhájil své místo na slunci, musel si všímat vzorů v platbách (od frekvence, proměnnosti výše, stálosti a penza používaných symbolů, …), charakteristik klientů, časových souvislostí, transakčních poznámek, … Takže na konci procesu mohl rázně přednést: data hovoří jasně, můj milý Watsone!

Se zkušeností roste síla

Klasifikační algoritmy, mezi které detekce splátkových transakcí spadá, dělíme na dvě třídy - tzv. unsupervised learning a supervised learning algoritmy. První jmenovaná připomíná bystré oko detektiva, které si všimne, že tady něco nehraje, že něco je jinak, než by mělo být… Ano, to může být někdy ošemetné – jak by se vám třeba líbilo, kdyby vás zavřeli, protože se chováte neobvykle dobře?!

Druhá třída, tedy supervised learning algoritmy, připomíná výcvik detektiva – na akademii ho seznámíme s velkým množstvím již vyřešených případů a necháme ho, aby konal detektivní práci sám. Bohužel ani tento přístup není samospasný – svět se mění a zločinci přicházejí s novými a novými způsoby, jak přelstít ruku zákona. Tak nějak tušíme, že schopný detektiv používá oba přístupy.

Nejinak tomu je i v živé světě splátek. Úvěrové společnosti vznikají a zanikají, zvyklosti klientů se mění, … Pokud bychom chtěli například výčet bankovních účtů úvěrových společností, velmi rychle nám zastará. A P2P půjčky či půjčky mezi přáteli by byly nepostižitelné…

V rámci Installment detectoru jsme proto nechali promluvit samotné klienty a implementovali jsme meta-model reflektující tuto dynamiku. A to není jediný případ, kdy náš digitální detektiv může zužitkovat znalosti. Bayesovské sítě, jenž dřímají v jeho nitru, k iterativnímu zlepšování přímo vybízí.

Od splátek spotřebitelských úvěrů je jen krůček k hypotékám a leasingům. A další k jiným typům transakcí –stačí detektiva naučit všímat si jiných stop.

Dominik Matula Dominik Matula
Autor článku je Senior Data Scientist ve společnosti Profinit.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Význam automatizace a digitalizace v post-pandemickém světě

IT Systems 6/2020V aktuálním vydání IT Systems se věnujeme především roli digitálních technologií v post-pandemickém světě. Zatímco se život postupně vrací do normálu, podniky se musí pustit do sanace škod a začít revitalizovat své provozy a procesy. Pandemie připravila pro mnohé firmy intenzivní zatěžkávací zkoušku. Současně ale jasně ukázala, čemu by podniky měly věnovat pozornost, aby svou provozuschopnost zabezpečily i do budoucnosti.