facebook LinkedIN LinkedIN - follow
IT SYSTEMS 9/2020 , AI a Business Intelligence , DMS/ECM - Správa dokumentů

Robotizace a kognitivní automatizace dokumentů

Díl 4: Jak změřit úspěšnost řešení digitalizace?

Tomáš Dolejš


INFOMATICVítejte u čtvrtého dílu naší šestidílné série, která vás provází cestou nejnovějších trendů v multikanálovém snímání dokumentů a inteligentního OCR, s představením, jak umělá inteligence napomáhá v robotizaci a celkové automatizaci zpracování dokumentů a dat. Dnes se zaměříme na techniky, jak nejlépe změřit úspěšné fungování nového řešení pro digitalizaci dokumentů a dat.


prvním díle jsme popsali, jakým způsobem robotizace umožňuje firmám řešit problémy s automatizací manuálních úkonů. Zároveň jsme vysvětlili důvod, proč kombinovat roboty se zpracováním dokumentů a proč je RPA technologie samotná pro tuto činnost neefektivní. V druhém díle jsme přiblížili technologii kognitivní automatizace dokumentů (CDA), která takzvanou „prací hlavou“ dokáže porozumět obsahu dokumentu nebo emailu a v nich obsaženým informacím, a dále rozhodnout, co s takovým dokumentem nebo emailem udělat. Zároveň jsme vysvětlili, proč je robotizace ve spojení s automatizací zpracování dokumentů natolik účinná pro zefektivnění obchodních procesů tak účinná. Ve třetím díle jsme vám „naservírovali“ nákupní seznam funkcí, které by u vás při výběru nové technologie neměly chybět. Ve čtvrtém díle vám chceme odpovědět na jedinou otázku: „Jakým způsobem změřit úspěšné fungování nového řešení pro digitalizaci?“

Na začátek si zkusme odpovědět na otázku, co je primárním cílem digitalizace? Zavedení nového systému automatizace zpracování dokumentů má přinést benefity v snadnějším dohledávání dokumentů, snížení nákladů, umožnění celkově rychlejšího zpracování firemních procesů díky eliminaci chyb a zároveň lepšího zapojení vašich zákazníků do celkového procesu zpracování dokumentů – pamatujete? Ve druhém díle jsme popisovali, proč je v celkové automatizaci důležité nechat zákazníka vybrat jím preferovaný kanál pro doručení jeho dokumentu.

Pokud jde o samotné změření úspěšného fungování nového řešení pro kognitivní automatizaci zpracování dokumentů, pak jediným správným ukazatelem úspěšnosti je produktivita uživatele. Produktivitu lze měřit dle dvou hlavních ukazatelů. Těmi je úspěšnost automatizace vytěžování dat - přesnost OCR a samotná efektivita práce uživatele.

Přesnost OCR

Snad nejběžnější otázkou při demo ukázce technologie pro digitalizaci dokumentů a vytěžování dat je: Jakou úroveň přesnosti OCR mohu očekávat? Krátká odpověď zní: Liší se dle případu použití. Přesnost OCR a obecněji přesnost klasifikace typu dokumentů a vytěžování dat je určována několika faktory, z nichž uveďme například:

  • Typ skeneru
  • Nastavení rozlišení při skenování
  • Kvalita snímaného obrazu
  • Druh dokumentu (formulář, faktura, dopis)
  • Strojově tištěné / ručně psané / kurzíva
  • Jazyk dokumentu
  • Typ písma a mezery mezi znaky
  • Vyplňovací pole / stínování
  • Schopnost pracovat s databází pro ověřování dat, využití kontrolních součtů a další pravidla

Každý z těchto bodů může být diskutován do mnohem většího detailu, nicméně prozatím si pamatujte: čím vyšší je přesnost, tím více je automatizována klasifikace a vytěžování; čím nižší je přesnost, tím méně je automatizována a bude třeba více manuální práce lidí v procesu celkového zpracování. Srovnávací testování na skutečných vzorových dokumentech je vysoce doporučené, neboť přesnost může být na základě výše uvedených faktorů výrazně odlišná. Srovnání vám dá první výsledky z klasifikace typů dokumentů a vytěžování obsahu dokumentů a tím napoví, zda jsou vaše dokumenty graficky způsobilé pro automatizaci, zda dokumenty obsahují prvky a obsah, dle kterého lze jednoznačně provést automatizovanou klasifikaci, zda obsah dokumentu lze zpracovávat pomocí OCR nástrojů uvnitř softwaru a mnoho dalšího. Výsledky zároveň slouží k optimalizaci nastavení pro každý typ zpracovaného dokumentu a dat, a tím ke zvýšení přesnosti a míry automatizace.

Metrika pro změření výsledků automatizace zpracování je založena na poměru dokumentů, které prošly systémem bez zásahu uživatele. Procento dokumentů, které projdou automaticky přes procesy: ZÍSKAT – POCHOPIT – INTEGROVAT (viz. druhý díl), měří úspěch OCR zpracování obsahu. Celková rychlost zpracování se vždy odvíjí od oblastí dat pro vytěžování s nejnižší přesností OCR. Pro navýšení rychlosti zpracování je vždy důležité, zaměřit se právě na tyto pole a oblasti dat pro vytěžování.

Produktivita uživatele

Přesnost OCR je pouze jednou stranou mince produktivity uživatelů. Druhou stranou je efektivita uživatele při zpracování výjimek v celkovém procesu digitalizace. Dokumenty a datová pole, které neprojdou automatizovaným zpracováním, software nabídne lidem k manuální kontrole z důvodu nízké důvěry zpracování. Výsledek, pod námi nastaveným prahem důvěry v systém, musí být zkontrolován pro ověření správnosti klasifikace typu dokumentu nebo vytěženého obsahu z dokumentu.

Jednoduše řečeno, efektivita uživatele spočívá v tom, jak rychle dokáže zkontrolovat dokument nebo pole s nízkou důvěrou a udělat rozhodnutí o tom, co je třeba opravit nebo potvrdit, a poté toto rozhodnutí provést. Rozhraní softwaru pro validaci dat uživatelem musí být navrženo pro co nejefektivnější použití očí a rukou.

Několik příkladů funkcí pro větší efektivitu uživatelů ve validaci dat:

  • Semaforový systém zelená – červená, který okamžitě poskytuje vizuální identifikaci problému.
  • Skok pouze na dokument a červené pole, které obsahuje problém.
  • Zvýraznění tohoto pole na skutečném snímku pro lepší vnímání kontextu.
  • Zobrazení části obrazu, která obsahuje data na dokumentu, kontrolované oproti výsledkům z OCR.
  • Vlastní rozmístění ovládacích panelů a oken pro kontrolu dle přání uživatelů.
  • Oprava jednoho znaku v poli namísto opětovného vypisování celého textu.
  • Používání klávesové zkratky vyvolání databáze pro kontrolu daného pole.
  • Automatické vyplnění pole na základu typu dokumentu nebo výsledků celostránkového OCR.
  • Vyplnění dat pouhým kliknutím na data v samotném obrazu dokumentu.

Je důležité zaměřit se na efektivitu uživatele, a to již při samotném designu nového řešení a nastavení zpracování, stejně jako při zavádění systému a prvních týdnech používání. Uživatelé musí získat důvěru v systém a zároveň pochopit a případně optimalizovat ovládání softwaru. Celkovou produktivitu uživatele ovlivní efektivita ovládání softwaru daleko více než úsilí vynaložené pouze na výsledek OCR. Zapojení uživatele do procesu a snížení počtu stisknutí kláves nebo použití myši je pro celkové urychlení času zpracování zásadní.

Produktivita uživatelů

Kombinací výše popsaných metrik úspěšnosti lze změřit celkovou produktivitu uživatele. Pamatujte na to, že je vždy dobré mít vstupní data před samotným započetím realizace řešení pro digitalizaci a automatizaci zpracování dat. Větší vhled do produktivity zpracování vám jistě dá informace, kolik byl uživatel v procesu schopen zpracovat dokumentů za hodinu/den/týden/měsíc a kolik dokumentů je schopen zpracovat po nasazení nového řešení v daném čase. To je určitě daleko hodnotnější informace, než zda OCR engine dává výsledky z 80% nebo 95% úspěšností. Ve vašich navazujících procesech nebo systémech přece chcete 100% správná data. Proto je nutné určovat úspěšnost řešení přes celkovou produktivitu uživatele, a nikoliv pouze přes výsledek OCR.

V závislosti na typu a rozsahu zpracovávaných dokumentů a nastavení řešení pro digitalizaci a automatizaci lze očekávat návratnost investice do systému mezi 6 – 18 měsíci od spuštění systému. Pokud vás téma efektivity zpracování, měření úspěšnosti OCR a tvorba úspěšného zadání projektu pro automatizované zpracování zaujala, máme pro vás ke stažení obsáhlejší dokument „Pravda o přesnosti OCR - Metrika úspěšnosti automatizace dokumentů“.

Příště

pátém díle se podíváme na některé z výzev, s nimiž se zákazníci, využívající RPA (automatickou robotizaci procesů), potýkají při implementaci řešení automatizace zpracování dokumentů, při snaze maximalizovat produktivitu uživatelů.

Tomáš Dolejš Tomáš Dolejš
Autor článku je ředitelem společnosti INFOMATIC.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.