facebook LinkedIN LinkedIN - follow
IT SYSTEMS 3/2018 , CRM systémy , AI a Business Intelligence

Rozhovor na téma big data a jejich využití s Dagmar Bínovou ze společnosti Adastra



Dagmar BínováDagmar Bínová působí ve společnosti Adastra jedenáct let, nejprve jako data miner, nyní na pozici big data science lead, v níž se soustřeďuje na využití velkých dat. Zaměřuje se především na modelování a datové analýzy s významným přínosem pro byznys zákazníků z bankovnictví, telekomunikací či automobilového průmyslu. Dlouhodobě se také věnuje lektorské a publikační činnosti. Dříve pracovala na Českém statistickém úřadě, kde se podílela na rozvoji nových statistických šetření a využívání administrativních zdrojů dat v oblasti zemědělství a bezpečnosti potravin. Zahraniční pracovní zkušenosti sbírala v lucemburském Eurostatu.


Jak byste definovala big data? Co z nich dělá to „big“, a čím se tedy vlastně odlišují od jiných dat?

Pojem big data doslovně vysvětluje, že máme k dispozici hodně dat. To označení „hodně“ je ale v čase relativní, objemy dat v různých oblastech různými vlivy exponenciálně rostou. Proto je nutné definici big dat doplnit ještě o nějaká další specifika. Jedním z nich může být podmínka soustavného vzniku nových dat. Dalším specifikem může být, že tato data nemusí být strukturovaná (tj. nelze z nich okamžitě tvořit tabulky a grafy) a pro jejich další využití je většinou nutné s nimi provést nějaké transformace. A do třetice, big data vznikají na základě interakcí, jednak interakcí člověka s nějakým zařízením (např. klient platí platební kartou) nebo interakcí zařízení s jiným zařízením (telefon se pravidelně hlásí k mobilní síti).

Pokud to shrneme, nejčastěji se řeší úlohy, kdy nám data chodí v téměř reálném čase a jejich ukládáním můžeme tvořit bohatou sbírku reflektující vývoj a historii.


S tím souvisí další otázky: Proč se podle vás o big datech teď tak mluví? Znamenají opravdu tak zásadní změnu v práci s informacemi v obchodě? Nejsou spíš trendovým výrazem?

Oblast big dat se rozvíjí především díky tomu, že jsou konečně k dispozici finančně dostupná velkokapacitní a bezpečná hardwarová zařízení a k nim se vyvíjí softwarové prostředky. Tím, že se dají data relativně jednoduše zpracovávat téměř v reálném čase, a tím, že máme mnohem bohatší databáze, můžeme big data považovat za zlatý důl. V dnešní době je mnohem těžší data smysluplně využít, než je posbírat. Klíčové je vědět, k čemu nové informace z té obrovské hromady poslouží a čemu to může prospět. Právě odpovědi na tyto otázky jsou nejzásadnější a často s nimi musíme přijít my jako data scientisti.

Pro představu, jak se dá s big daty pracovat: Klient banky zaplatí převodem zájezd, což lze poznat v popisu příkazu, pokud ho klient samozřejmě zadá. Banka pak může takovému klientovi obratem nabídnout cestovní pojištění. Ačkoliv to vypadá velmi jednoduše a samozřejmě, banky dosud neměly nástroje, jak v téměř reálném čase takového klienta identifikovat, natož mu nabídnout relevantní službu.


Jaké zdroje velkých dat vlastně vaše společnost nejčastěji využívá? E-shopy, karetní platební transakce...?

Máme celou řadu projektů, které bohužel nemůžeme zveřejňovat, inovace patří mezi obchodní tajemství. Co lze veřejně uvést, je, že ve financích pracujeme s transakcemi, v telekomunikacích se signálními daty, na webu se záznamy o pohybech na stránkách, v obchodě a ve výrobě se senzorickými daty, napříč odvětvími s logovými daty z aplikací.


Jak se v současnosti využívají big data v retailu? Jak s nimi obchodníci a dodavatelé pracují?

Viditelný úspěch zaznamenávají big data v oblasti e-commerce. Z chování zákazníka v e-shopu, např. o čase, způsobu a rychlosti nakupování, lze vyvodit spoustu zajímavých vzorů chování zákazníka, které lze využít pro vylepšení procesu prodeje a obsluhy. S postupným příchodem technologií IoT se chystají i změny v prodeji v kamenných obchodech. Díky čidlům a senzorům umístěným u zboží může prodejní personál získávat automatickou nápovědu nejvhodnější péče o zákazníka. Nápověda vznikne na základě okamžitého zpracování dat ze senzorů, porovnáním s historickými událostmi a na základě doporučení, které se spočítá modelem. Čili dopady big dat a IoT technologií do obchodu jsou zřejmé.


Jaké jsou hlavní výhody využití velkých dat?

Pomocí big dat mohou firmy především lépe poznat své zákazníky a jejich chování. Tím, že big data tvoří nejen klasická čísla, ale i různé logy, transakce, signální data, senzorická data, texty, obrázky, hlasy či videa, tak je jejich využitelnost možná v každém odvětví. Například banky mohou schválit úvěr i člověku, který by jinak neprošel, pokud se z dat ukáže, že je spolehlivý a zodpovědný.

Big data se dnes využívají i mimo obchod. Například v oblasti budování chytrých měst, kdy můžete na základě sběru dat vyhodnocovat, odkud a kam lidé jezdí. Můžete tedy upravit jízdní řády nebo silniční značení. Mobilní operátoři totiž vědí, kde se pohybují mobilní zařízení.

Nemusí to být jen data telefonních operátorů, ale třeba i data ze sociálních sítí, pokud zákazníci povolí bankám přístup k informacím, například za slevu na poplatcích. Výzkumy ukazují, že pokud zákazníci získají výhody, tak nevnímají sběr dat negativně a přístup povolí.


Říkáte, že například banky mohou schválit úvěr i člověku, který by jinak neprošel, pokud se z dat ukáže, že je spolehlivý a zodpovědný. Jaká data tedy máte na mysli, odkud je čerpáte?

Tady se jedná o standardní využití transakčních dat v bance. Nové na tom je, že se nepracuje pouze s roční historií, ale třeba desetiletou, a dokážete klienta díky dlouholetému „pozorování“ vhodně zařadit do životního cyklu a pochopit jeho finanční chování. To, že klient je v určité době bez finančních prostředků a nevychází mu skóre pro úvěr, ještě neznamená, že je typický neplatič nebo člověk, který si neumí vydělat peníze a splácet. Momentální nepříznivá situace vs. dlouhodobá znalost stálého klienta, to je to, oč tu běží. A k tomu se tyto informace dají samozřejmě obohatit i o nějaké externí zdroje informací z různých registrů.


Jaká jsou naopak úskalí v jejich využití?

Vše, co je výhodou, je zároveň i rizikem. Na jednu stranu lepší znalost zákazníka by měla např. bance umožnit zjednodušení obsluhy klienta díky vylepšeným procesům. Na druhou stranu je tu jisté reputační riziko, kterého se nesprávným nebo nevhodným využitím velkých dat může společnost dopustit. Proto je tu legislativa ohledně ochrany dat, která nutí společnosti k tomu, aby nakládaly se svými daty obezřetně a dodržovaly zákonné rámce.

Jisté úskalí přichází s big daty v tom, že společnosti musejí při jejich využití pozměnit IT infrastrukturu, proškolit nové specialisty a také se musí mentálně nastavit na změny v postupech, které s novými prvky a z nich plynoucími novými znalostmi přicházejí.


Můžete popsat nějakou konkrétní kampaň / marketingovou aktivitu, která byla postavena na využití velkých dat?

Pro jednu banku jsme identifikovali zákazníky, kteří mají děti. Zároveň jsme zjistili, že v září mají největší výdaje, a tak jsme těmto skupinám zákazníků dokázali ve správný čas nabídnout vhodný úvěrový produkt. Akce byla 10x úspěšnější než při použití standardních postupů bez využití big dat.


Z jakých zdrojů informací jste vycházeli? A co těmi standardními postupy míníte?

U této kampaně jsme vycházeli z dlouholetých popisků transakcí. Identifikaci rodiny s dětmi v bance dosud nikde v systémech řádně neměli a pro aktuálnost a pravdivost, že se jedná o rodinu s dětmi, jsme potřebovali celou řadu identifikovaných transakcí specifického typu. Pro nabídku úvěrového produktu se obvykle hledají jednodušší pravidla (např. výše zůstatku a kreditní limit).

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Jak zkrotit chaos ve firemních dokumentech

IT Systems 4/2024Dominantní částí aktuálního vydání IT Systems je příloha věnovaná kybernetické bezpečnosti, ale najdete v něm také řadu jiných témat. Věnujeme se především trendům v digitalizaci výroby, ale i problematice ESG reportingu a využití virtuální a rozšířené reality v průmyslu. Ukážeme vám také, jak zkrotit chaos ve firemních dokumentech.