facebook LinkedIN LinkedIN - follow
Tematické sekce
 
Branžové sekce
Přihlášení SystemNEWSPřehledy
 
Tematické seriály

Jak uřídit IT projekt a nezbláznit se

Užitečné tipy a nástroje pro řešení problémů řízení inovací a vývoje produktů...

články >>

 

Industry 4.0

Průmysl 4.0

Jaký vliv bude mít čtvrtá průmyslová revoluce na výrobu a výrobní firmy?

články >>

 
Nové!

RPA - automatizace procesů

Softwaroví roboti automatizují obchodní procesy.

články >>

 
Nové!

IoT – internet věcí

Internet věcí a jeho uplatnění napříč obory.

články >>

 
Nové!

VR – virtuální realita

Praktické využití virtuální reality ve službách i podnikových aplikacích.

články >>

 
Nové!

Bankovní identita (BankID)

K službám eGovernmentu přímo z internetového bankovnictví.

články >>

 

Příručka úspěšného IT manažera

Dnes je řada IT manažerů opomíjena. Úspěšní bývají brouci Pytlíci a Ferdové...

články >>

 
 
Partneři webu
Big Data a Business Intelligence , AI a Business Intelligence

Budoucnost je v nestrukturovaných datech

Jan Růžička, Miroslav Nečas


Budoucnost je v nestrukturovaných datechFirmy zpracovávají stále větší objemy dat a nic nenasvědčuje tomu, že by se měl tento trend zvrátit. Kvůli velkému množství a různorodosti dat mnozí často ani netuší, jaká data mají k podpoře svých klíčových činností využívat a co vše z nich lze relativně snadno získat. Mimochodem, vzpomenete si ještě na dobu, kdy nás fascinoval počet listů formátu A4 odpovídající jedné disketě? Poté počet knih na jednom cédéčku?


Většina dat je ale nestrukturovaných, ať již jde o texty, obrázky, audionahrávky nebo videa. Strukturovaných dat, tedy těch s přesnou logickou strukturou, například v podobě tabulek, je oproti tomu relativně málo – dle některých odhadů tvoří pouze jednotky procent. Zatímco práce s nestrukturovanými daty je pro člověka přirozená a často příjemná, u počítačů je tomu právě naopak. Problémy mohou způsobovat také data, která jsou sice strukturovaná, ale jinak, než je pro konkrétní počítačové zpracování vhodné.

Kontaktní centra by mohla vyprávět

Skvělý příklad zpracování velkého množství nestrukturovaných dat představují kontaktní centra, kde jsou nejčastějším vstupem telefonické rozhovory se zákazníky a poznámkami operátorů. Tedy kombinace mluveného slova a psaného textu. V podstatě jakékoli zpracování, od okamžitých reakcí na slovní spojení přes ověřování kvality poskytnuté služby až po pokročilé analýzy, je bez využití technologií schopných práce s nestrukturovanými daty časově i finančně náročné a značně nepřesné. Například kontrola kvality v primitivní podobě vyžaduje individuální dodatečné náslechy, které lze zvládnout maximálně v rozsahu jednotek procent celkového objemu hovorů a s časovým odstupem nejméně v řádu hodin.

Základní možností alespoň částečného zlepšení je ruční značkování hovorů pracovníky centra, zpravidla formou výběru z předpřipravených seznamů či vkládáním komentářů. Nicméně i zde zůstává řada problémů včetně vlivu subjektivních pocitů operátora a nutnosti kvalitní přípravy kategorií. Předpřipravené seznamy jsou zase prakticky nepoužitelné pro hlubší analýzu. Prostě proto, že předem připravené hodnoty nikdy nemohou pokrýt všechny možnosti potenciálního zájmu a zpětné zpracování není možné. Vyhodnocení ručně psaných komentářů je zase velmi pracné a často vede k zavádějícím výsledkům.

Fúze dat
Aby byly výsledky analytického zpracování validní, je třeba často porovnávat data z většího počtu různorodých zdrojů. To nelze bez jejich propojení do jednoho celku, který zahrnuje širší škálu nestrukturovaných i strukturovaných dat. Tento proces označujeme jako fúzi dat nebo datovou fúzi.

Hlas na text

Dlouhodobě správnou a účinnou cestou je převod hlasového záznamu do textové podoby, kterou pak lze využít při běžném operativním zpracování i detailních analýzách. Zpracování spontánní řeči však není jednoduché. Kvalita nahrávky, výslovnost různých mluvčích, neúplnost promluvy, chybějící interpunkce či nedodržování slovosledu jsou jen některé z problémů, se kterými je třeba se vypořádat. Technologie pro hlasové analýzy tak musí pracovat s určitou mírou neurčitosti.

Hlavním přínosem práce s textovými přepisy – tedy stále ještě nestrukturovanými daty – jsou podstatně širší analytické možnosti, jako je dohledávání souvislostí nebo odhalování trendů ve velkém množství hovorů. To vše navíc s možností zpětného vyhodnocování na základě průběžně definovaných kritérií. Jinými slovy, pokud se management rozhodne zjistit, jak volající mluvili o produktu XYZ, jen se připraví a vhodné dotazy a spustí se nad přepisy z minulého měsíce. Příkladem může být i průběžné vyhodnocování marketingové kampaně založené na telefonickém oslovování a její přizpůsobování zjištěným závěrům. Třeba i včetně okamžitého ukončení, pokud se ukáže, že není naděje na dosažení rentability kampaně. S čistě hlasovými nahrávkami by cokoli z uvedeného bylo v podstatě nemyslitelné, protože všechny záznamy by bylo nutné opět poslechnout.

Obdobně je možné rychleji reagovat na zjištěná fakta v aktuálně probíhajících hovorech a poskytovat tak operátorům kvalitní podklady pro další směrování rozhovoru. V přepisech lze velmi jednoduše najít i typické prodejní situace a tato nestrukturovaná data tak v praxi slouží i pro školení operátorů.

Z důvodu bezpečnosti a legislativních požadavků jsou přepisy hovorů zpracovávány nejčastěji v infrastruktuře zákazníka, byť technicky nic nebrání jejich analytickému zpracování v prostředí cloudu.

Méně znalé možná překvapí, že implementace řešení pro převod hovorů a pro analýzu jejich textové podoby je sice náročný úkol, ale technická otázka je pouze částí problému. A často tou menší. Zásadní je vyspecifikovat očekávání a následně systém správně využívat. Což znamená svěřit definování pravidel pro hodnocení hovorů člověku znalému interních procesů – nejčastěji jde o pozici metodika nebo hlasového analytika.

Dodavatel ani technologie to, co má sledovat a hodnotit, za zákazníka nevymyslí. Pomůže mu ale s implementací pravidel a poradí mu na základě zkušenosti z již realizovaných projektů. Představa, že systém zpracovávající nestrukturovaná data poskytne něco sám o sobě, je bohužel mylná. Ale naštěstí zase ne tak častá, jak by se mohlo na první pohled zdát.

Chatovací roboti
Analýza nestrukturovaných dat v reálném čase je důležitá i pro tzv. chatovací roboty. Čeština sice nepatří mezi jazyky, ve kterých je tato technologie nejdál, nicméně v blízké budoucnosti se to změní a český jazyk bude „chat boty“ plně podporován. A drobná poznámka na okraj – pro mnohé z nás je tento způsob komunikace příjemnější tehdy, pokud nejsme přesvědčováni o falešné lidské identitě chatovacího robota.

Využitelnost, kam se podíváte, návratnost rychlá

Uvedené principy a zpracování nestrukturovaných dat se již dnes uplatňují i v jiných odvětvích včetně bankovnictví a pojišťovnictví. Analýzy například pomáhají s odhalováním pojistných podvodů, a to díky zpracování dat pocházejících z různorodých zdrojů a vytváření komplexního pohledu na danou událost v souvislostech. Navíc tyto analýzy přináší nejen zjištění, že k něčemu došlo, ale nabízí i informace o tom proč se tak stalo a jak vzniklou situaci nejlépe řešit. Časové úspory jsou navíc opravdu významné, z týdnů na jednotky hodin.

Podstata pokročilých analýz nestrukturovaných dat ale není v tom, že by takové zpracování mělo k dispozici více dat než třeba likvidátor – zásadní je smysluplné propojení dat a efektivní analýza nad jedním celkem. Důležitá je také vhodná vizualizace informací v podobě vztahových diagramů, map a grafů s podporou funkcionality známé z tradičních analytických nástrojů, která umožní snadno pochopit podstatu problému a prezentovat výsledky analýzy dalším lidem.

Alternativou výše popsaných přístupů může být i strojové učení, nicméně s řadou ale. Tím nejzásadnějším problémem je, že aby byly dosaženy relevantní výsledky, musí se stroj nejprve „naučit“ na relativně velkém množství dat. To v podstatě omezuje aplikaci na opakované problémy. A s ohledem na časové a finanční nároky se to vyplatí pouze u často opakovaných úloh. Zapomenout nelze ani problematickou interpretovatelnost výsledků a jejich přenositelnost do business pravidel.

Zpracování nestrukturovaných dat má jednoznačně skvělou budoucnost a může pomoci se zefektivněním v mnoha oblastech, pro které je práce s informacemi alfou a omegou úspěchu. Je navíc perfektní, že mezi špičku v tomto oboru patří právě česká firma, která tak v přeneseném slova smyslu potvrzuje rčení o zlatých českých ručičkách. A to je důležité i pro společnost Dimension Data, která v projektech zaměřených na nestrukturovaná data působí často jako systémový integrátor.

Jan Růžička
Jan Růžička
Autor článku působí jako Business Development Manager ve společnosti Dimension Data. Od roku 1994 pracuje v oblasti komunikačních řešení a kontaktních center.
Miroslav Nečas
Miroslav Nečas
Druhý autor článku působí jako Business Development Manager ve společnosti TOVEK. Od roku 2006 se zabývá problematikou analýzy nestrukturovaných dat. Stál u zrodu řešení hlasových analýz pro kontaktní centra.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.