www.systemonline.cz

Hlavní partner sekce

Tematické sekce

ERP systémy

CRM systémy

Plánování a řízení výroby

AI a Business Intelligence

DMS/ECM - Správa dokumentů

HRM/HCM - Řízení lidských zdrojů

EAM/CMMS - Správa majetku a údržby

Účetní a ekonomické systémy

ITSM (ITIL) - Řízení IT

Cloud a virtualizace IT

IT Security

Logistika, řízení skladů, WMS

IT právo

GIS - geografické informační systémy

Projektové řízení

Trendy ICT

E-commerce B2B/B2C

CAD/CAM/CAE/PLM/3D tisk

Branžové sekce

Automobilový průmysl

Banky a finanční organizace

Energetika a utility

Potravinářský průmysl

Stavebnictví - BIM, CAFM

Veřejný sektor a zdravotnictví

SystemNEWS



Přihlaste se k odběru newsletteru SystemNEWS, který každý týden přináší výběr článků z oblasti podnikové informatiky

Archiv SystemNEWS

Přehledy

Přehledy IS
APS (20)
BPM - procesní řízení (22)
Cloud computing (IaaS) (10)
Cloud computing (SaaS) (33)
CRM (51)
DMS/ECM - správa dokumentů (20)
EAM (17)
Ekonomické systémy (68)
ERP (77)
HRM (27)
ITSM (6)
MES (32)
Řízení výroby (37)
WMS (31)
Dodavatelé IT služeb a řešení
Datová centra (25)
Dodavatelé CAD/CAM/PLM/BIM... (39)
Dodavatelé CRM (33)
Dodavatelé DW-BI (50)
Dodavatelé ERP (71)
Informační bezpečnost (50)
IT řešení pro logistiku (45)
IT řešení pro stavebnictví (25)
Řešení pro veřejný a státní sektor (27)

Inzerce

Partneři webu

Best WordPress Themes

Hlavní strana -> Časopis IT Systems -> Rok 2017 -> Big Data a Business Intelligence -> Budoucnost je v nestrukturovaných datech

Big Data a Business Intelligence , AI a Business Intelligence

Budoucnost je v nestrukturovaných datech

Jan Růžička, Miroslav Nečas

Firmy zpracovávají stále větší objemy dat a nic nenasvědčuje tomu, že by se měl tento trend zvrátit. Kvůli velkému množství a různorodosti dat mnozí často ani netuší, jaká data mají k podpoře svých klíčových činností využívat a co vše z nich lze relativně snadno získat. Mimochodem, vzpomenete si ještě na dobu, kdy nás fascinoval počet listů formátu A4 odpovídající jedné disketě? Poté počet knih na jednom cédéčku?

Většina dat je ale nestrukturovaných, ať již jde o texty, obrázky, audionahrávky nebo videa. Strukturovaných dat, tedy těch s přesnou logickou strukturou, například v podobě tabulek, je oproti tomu relativně málo – dle některých odhadů tvoří pouze jednotky procent. Zatímco práce s nestrukturovanými daty je pro člověka přirozená a často příjemná, u počítačů je tomu právě naopak. Problémy mohou způsobovat také data, která jsou sice strukturovaná, ale jinak, než je pro konkrétní počítačové zpracování vhodné.

Kontaktní centra by mohla vyprávět

Skvělý příklad zpracování velkého množství nestrukturovaných dat představují kontaktní centra, kde jsou nejčastějším vstupem telefonické rozhovory se zákazníky a poznámkami operátorů. Tedy kombinace mluveného slova a psaného textu. V podstatě jakékoli zpracování, od okamžitých reakcí na slovní spojení přes ověřování kvality poskytnuté služby až po pokročilé analýzy, je bez využití technologií schopných práce s nestrukturovanými daty časově i finančně náročné a značně nepřesné. Například kontrola kvality v primitivní podobě vyžaduje individuální dodatečné náslechy, které lze zvládnout maximálně v rozsahu jednotek procent celkového objemu hovorů a s časovým odstupem nejméně v řádu hodin.

Základní možností alespoň částečného zlepšení je ruční značkování hovorů pracovníky centra, zpravidla formou výběru z předpřipravených seznamů či vkládáním komentářů. Nicméně i zde zůstává řada problémů včetně vlivu subjektivních pocitů operátora a nutnosti kvalitní přípravy kategorií. Předpřipravené seznamy jsou zase prakticky nepoužitelné pro hlubší analýzu. Prostě proto, že předem připravené hodnoty nikdy nemohou pokrýt všechny možnosti potenciálního zájmu a zpětné zpracování není možné. Vyhodnocení ručně psaných komentářů je zase velmi pracné a často vede k zavádějícím výsledkům.

Fúze dat
Aby byly výsledky analytického zpracování validní, je třeba často porovnávat data z většího počtu různorodých zdrojů. To nelze bez jejich propojení do jednoho celku, který zahrnuje širší škálu nestrukturovaných i strukturovaných dat. Tento proces označujeme jako fúzi dat nebo datovou fúzi.

Hlas na text

Dlouhodobě správnou a účinnou cestou je převod hlasového záznamu do textové podoby, kterou pak lze využít při běžném operativním zpracování i detailních analýzách. Zpracování spontánní řeči však není jednoduché. Kvalita nahrávky, výslovnost různých mluvčích, neúplnost promluvy, chybějící interpunkce či nedodržování slovosledu jsou jen některé z problémů, se kterými je třeba se vypořádat. Technologie pro hlasové analýzy tak musí pracovat s určitou mírou neurčitosti.

Hlavním přínosem práce s textovými přepisy – tedy stále ještě nestrukturovanými daty – jsou podstatně širší analytické možnosti, jako je dohledávání souvislostí nebo odhalování trendů ve velkém množství hovorů. To vše navíc s možností zpětného vyhodnocování na základě průběžně definovaných kritérií. Jinými slovy, pokud se management rozhodne zjistit, jak volající mluvili o produktu XYZ, jen se připraví a vhodné dotazy a spustí se nad přepisy z minulého měsíce. Příkladem může být i průběžné vyhodnocování marketingové kampaně založené na telefonickém oslovování a její přizpůsobování zjištěným závěrům. Třeba i včetně okamžitého ukončení, pokud se ukáže, že není naděje na dosažení rentability kampaně. S čistě hlasovými nahrávkami by cokoli z uvedeného bylo v podstatě nemyslitelné, protože všechny záznamy by bylo nutné opět poslechnout.

Obdobně je možné rychleji reagovat na zjištěná fakta v aktuálně probíhajících hovorech a poskytovat tak operátorům kvalitní podklady pro další směrování rozhovoru. V přepisech lze velmi jednoduše najít i typické prodejní situace a tato nestrukturovaná data tak v praxi slouží i pro školení operátorů.

Z důvodu bezpečnosti a legislativních požadavků jsou přepisy hovorů zpracovávány nejčastěji v infrastruktuře zákazníka, byť technicky nic nebrání jejich analytickému zpracování v prostředí cloudu.

Méně znalé možná překvapí, že implementace řešení pro převod hovorů a pro analýzu jejich textové podoby je sice náročný úkol, ale technická otázka je pouze částí problému. A často tou menší. Zásadní je vyspecifikovat očekávání a následně systém správně využívat. Což znamená svěřit definování pravidel pro hodnocení hovorů člověku znalému interních procesů – nejčastěji jde o pozici metodika nebo hlasového analytika.

Dodavatel ani technologie to, co má sledovat a hodnotit, za zákazníka nevymyslí. Pomůže mu ale s implementací pravidel a poradí mu na základě zkušenosti z již realizovaných projektů. Představa, že systém zpracovávající nestrukturovaná data poskytne něco sám o sobě, je bohužel mylná. Ale naštěstí zase ne tak častá, jak by se mohlo na první pohled zdát.

Chatovací roboti
Analýza nestrukturovaných dat v reálném čase je důležitá i pro tzv. chatovací roboty. Čeština sice nepatří mezi jazyky, ve kterých je tato technologie nejdál, nicméně v blízké budoucnosti se to změní a český jazyk bude „chat boty“ plně podporován. A drobná poznámka na okraj – pro mnohé z nás je tento způsob komunikace příjemnější tehdy, pokud nejsme přesvědčováni o falešné lidské identitě chatovacího robota.

Využitelnost, kam se podíváte, návratnost rychlá

Uvedené principy a zpracování nestrukturovaných dat se již dnes uplatňují i v jiných odvětvích včetně bankovnictví a pojišťovnictví. Analýzy například pomáhají s odhalováním pojistných podvodů, a to díky zpracování dat pocházejících z různorodých zdrojů a vytváření komplexního pohledu na danou událost v souvislostech. Navíc tyto analýzy přináší nejen zjištění, že k něčemu došlo, ale nabízí i informace o tom proč se tak stalo a jak vzniklou situaci nejlépe řešit. Časové úspory jsou navíc opravdu významné, z týdnů na jednotky hodin.

Podstata pokročilých analýz nestrukturovaných dat ale není v tom, že by takové zpracování mělo k dispozici více dat než třeba likvidátor – zásadní je smysluplné propojení dat a efektivní analýza nad jedním celkem. Důležitá je také vhodná vizualizace informací v podobě vztahových diagramů, map a grafů s podporou funkcionality známé z tradičních analytických nástrojů, která umožní snadno pochopit podstatu problému a prezentovat výsledky analýzy dalším lidem.

Alternativou výše popsaných přístupů může být i strojové učení, nicméně s řadou ale. Tím nejzásadnějším problémem je, že aby byly dosaženy relevantní výsledky, musí se stroj nejprve „naučit“ na relativně velkém množství dat. To v podstatě omezuje aplikaci na opakované problémy. A s ohledem na časové a finanční nároky se to vyplatí pouze u často opakovaných úloh. Zapomenout nelze ani problematickou interpretovatelnost výsledků a jejich přenositelnost do business pravidel.

Zpracování nestrukturovaných dat má jednoznačně skvělou budoucnost a může pomoci se zefektivněním v mnoha oblastech, pro které je práce s informacemi alfou a omegou úspěchu. Je navíc perfektní, že mezi špičku v tomto oboru patří právě česká firma, která tak v přeneseném slova smyslu potvrzuje rčení o zlatých českých ručičkách. A to je důležité i pro společnost Dimension Data, která v projektech zaměřených na nestrukturovaná data působí často jako systémový integrátor.

	Jan Růžička Autor článku působí jako Business Development Manager ve společnosti Dimension Data. Od roku 1994 pracuje v oblasti komunikačních řešení a kontaktních center.
	Miroslav Nečas Druhý autor článku působí jako Business Development Manager ve společnosti TOVEK. Od roku 2006 se zabývá problematikou analýzy nestrukturovaných dat. Stál u zrodu řešení hlasových analýz pro kontaktní centra.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Časopis IT Systems / Odborná příloha

Více o časopisu IT Systems

Archiv časopisu IT Systems

Oborové a tematické přílohy

Kalendář akcí

červenec - 2026
Po	Út	St	Čt	Pá	So	Ne
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31	1	2
3	4	5	6	7	8	9

IT Systems podporuje

6.10.

Unicorn Banking Forum 2016

Formulář pro přidání akce

Další vybrané akce

17.8.	VMware vSphere: Install, Configure, Manage [V8]
1.9.	F5 Administering BIG-IP v.17.5
7.9.	Microsoft Azure Administrator: AZ-104
14.9.	Veeam Backup & Replication: Configure, Manage and...
14.9.	Citrix NetScaler ADC 14.x Administration
21.9.	VMware NSX: Install, Configure, Manage [V4.0]
22.9.	Check Point Certified Security Administrator (CCSA)...
30.9.	Konference Světlo

Další akce