- Přehledy IS
- APS (20)
- BPM - procesní řízení (22)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (33)
- CRM (51)
- DMS/ECM - správa dokumentů (20)
- EAM (17)
- Ekonomické systémy (68)
- ERP (77)
- HRM (27)
- ITSM (6)
- MES (32)
- Řízení výroby (36)
- WMS (29)
- Dodavatelé IT slueb a řeení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (39)
- Dodavatelé CRM (33)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (71)
- Informační bezpečnost (50)
- IT řeení pro logistiku (45)
- IT řeení pro stavebnictví (26)
- Řeení pro veřejný a státní sektor (27)
ERP systémy
CRM systémy
Plánování a řízení výroby
AI a Business Intelligence
DMS/ECM - Správa dokumentů
HRM/HCM - Řízení lidských zdrojů
EAM/CMMS - Správa majetku a údrby
Účetní a ekonomické systémy
ITSM (ITIL) - Řízení IT
Cloud a virtualizace IT
IT Security
Logistika, řízení skladů, WMS
IT právo
GIS - geografické informační systémy
Projektové řízení
Trendy ICT
E-commerce B2B/B2C
CAD/CAM/CAE/PLM/3D tisk![]() | |
| Přihlaste se k odběru newsletteru SystemNEWS, který kadý týden přináí výběr článků z oblasti podnikové informatiky | |
![]() | |
Robotizace a kognitivní automatizace dokumentů
Díl 5: 13 tipů, jak vytěit automatizaci zpracování dokumentů na maximum
Vítejte u pátého dílu naí estidílné série, která vás provází cestou nejnovějích trendů v multikanálovém snímání dokumentů a inteligentního OCR, s představením, jak umělá inteligence napomáhá v robotizaci a celkové automatizaci zpracování dokumentů a dat.

V prvním díle jsme popsali, jakým způsobem robotizace umoňuje firmám řeit problémy s automatizací manuálních úkonů. Zároveň jsme vysvětlili důvod, proč kombinovat roboty se zpracováním dokumentů a proč je RPA technologie samotná pro tuto činnost neefektivní. V druhém díle jsme přiblíili technologii kognitivní automatizace dokumentů (CDA), která takzvanou prací hlavou dokáe porozumět obsahu dokumentu nebo emailu a v nich obsaeným informacím, a dále rozhodnout, co s takovým dokumentem nebo emailem udělat. Zároveň jsme vysvětlili, proč je robotizace ve spojení s automatizací zpracování dokumentů tolik účinná pro zefektivnění obchodních procesů. Ve třetím díle jsme vám naservírovali nákupní seznam funkcí, které by u vás při výběru nové technologie neměly chybět. Ve čtvrtém díle jsme odpověděli na otázku: Jakým způsobem změřit úspěné fungování nového řeení pro digitalizaci?
V dnení páté části budeme popisovat obvyklé věci, se kterými jsme za dvacet let implementací těchto řeení setkali u naich zákazníků a jsou zcela běné při realizaci digitalizace. Pokud chcete úspěně implementovat řeení pro automatizaci zpracování dokumentů, pamatujte, e cílem je produktivita uivatelů (přesnost + efektivita viz. čtvrtý díl). Ostatně produktivita uivatelů je dnes hlavním motorem vekeré automatizace. A pomáháme uivatelům pomocným robotem, digitalizujeme firemní proces od A do Z nebo automatizujeme zpracování dokumentů a dat.
Nabízíme vám 13 tipů, jak zvládnout obvyklé trable a vytěit automatizaci zpracování dokumentů na maximum. Níe uvedené tipy obsahují popis a zároveň i radu, jak konkrétní věc řeit. Doporučujeme znát odpověď na řeení těchto věcí, a u budete vybírat jakoukoliv softwarovou technologii pro automatizaci zpracování dokumentů.
1. Zdroj obrázku
Zdroj obrázku ovlivňuje kvalitu obrazu a tím i úroveň klasifikace a přesnost vytěení dat. Typický příkladem je několikrát kopírovaný originál dokumentu, následně skenovaný, nebo kopie originálního dokumentu na průklepovém papíru. Tyto typy dokumentů jsou často nečitelné samotným okem a logicky mají nií kvalitu ne například digitální PDF dokument obdrený emailem. Úroveň kvality obrazu je závislá i na samotném hardwarovém zařízení. Ta poskytují různé výsledky dle konkrétního zařízení a výrobce. Přemýlejte také, zda jste vybaveni opravdovým dokumentovým skenerem či MFP zařízením, které v sobě skener má, nebo vám na stole stojí pouze tiskárna s moností osobního skenování.
2. Typ a rozliení obrazového souboru
Některé typy obrazových souborů mají lepí vlastní kvalitu ne jiné. TIFF s rozliením 300 dpi jsou nejčastějím typem souboru v produkčním zpracování dokumentů, nicméně ne vdy budete schopni zkontrolovat, jaký typ souboru a v jakém rozliení k vám přichází přes různé kanály z externích zdrojů. Obrazy dokumentů s niím rozliením budou mít logicky nií úroveň klasifikace typu dokumentů a obsahu i přesnosti vytěovaných dat. Pamatujte, e ideálním standardem, i s ohledem na výslednou velikost souboru, je 300 dpi (dots per image). Pod hranici 300 dpi se při zpracování dokumentů určitě nepoutějte.
3. Kvalita obrazu
S ohledem na kvalitu obrazu, můeme pro automatizaci zpracování dokumentů snadno pouít pořekadlo: jak se do lesa volá, tak se z lesa ozývá. Vícekrát faxované obrazy dokumentů; patně snímané obrazy pomocí mobilního zařízení, které jsou zkosené, rozostřené nebo patně osvětlené, dokumenty s razítky, čmáraninami, popisky uivatelů; dokumenty, které mají různé grafické pozadí a marketingové úpravy designu vechny tyto skutečnosti mají samozřejmě vliv na přesnost určení typu dokumentu a vytěování obsahu a dat. Nicméně nezoufejte. Profesionální softwarová řeení mají nástroje, jak obraz před zpracováním optimalizovat, jak navádět uivatele při snímání mobilním telefonem, aby drel telefon pevně, aby drel zařízení ve správném náklonu atd. Stejně tak dnení software dokáe před odesláním do zpracování zkontrolovat kvalitu obrazu a případně vyzvat uivatele k opětovnému nasnímání.
4. Sběr dokumentů
Počet vzorových dokumentů a jejich podobnost s dokumenty, které budou skutečně zpracovávány, také ovlivňuje budoucí přesnost a míru automatizace. Pamatujte, e dnení systémy se sami strojově učí a tedy platí, e čím více vzorů vaemu softwaru poskytnete, tím lépe se v automatizaci zpracování dokumentů naučí pracovat. Počet poadovaných vzorových dokumentů se pohybuje v rozmezí od několika kusů do stovek, v závislosti na typu dokumentu. Tyto vzory dokumentů mají co nejpřesněji odráet to, co bude v budoucnu skutečně zpracováváno.
5. Strukturované formuláře
Strukturované formuláře mají obecně nejvyí úroveň klasifikace a přesnosti vytěování dat a vyadují nejmení počet vzorových dokumentů. Vzhled formuláře má vak významný dopad na přesnost zpracování. Od vzdálenosti jednotlivých polí, prostoru pro vepsání znaku, naváděcích hrabiček, okének atd. k vedení uivatele při vyplňování, a po stínování polí. Je důleité uvaovat nad samotným vzhledem formuláře a mít monost vzhled formulářů upravit pro maximalizaci výsledků implementovaného softwaru pro automatizaci zpracování.
6. Polostrukturované dokumenty
Polostrukturované dokumenty (jako jsou faktury, objednávky, nabídky a dodací listy) obecně vykazují nií přesnost ne strukturované formuláře. Různá řeení automatizace zpracování dokumentů mají různé přístupy k vyhledání poadovaných dat a některá jsou spolehlivějí při hledání dat a jejich úspěném vytěení ne jiná. Tyto dokumenty mívají vloené tabulky (např. řádkové poloky faktury), více tabulek nebo tabulky v tabulkách, které mohou mít nií míru přesnosti vytěování ne jiná běná pole. Ověřte si, jak uvaované řeení dokáe vytěovat sloitějí typy dat a zároveň, jak v případě nízké kvality výsledků (kvalita obrazu, sloitost dat v tabulce atd.) lze uivatelem data doplnit = efektivita uivatele.
7. Nestrukturované dokumenty
Nestrukturované dokumenty, jako jsou emaily (obsah v jejich těle), dopisy a smlouvy, jsou nejnáročnějí pro automatickou klasifikaci a vytěení obsahu. Nicméně technologie jsou schopné dle obsahu poznat, zda vám píe zákazník se stíností, čeho se stínost týká a zároveň jakou povahu samotné sdělení má. Technologie zaloené na umělé inteligenci, jako je zpracování přirozeného jazyka (NLP), v posledních letech navýily poměr přesnosti vytěování dat i pro tyto typy dokumentů. Tím jste schopni okamitě v navazujícím procesu reagovat a eliminovat případnou ztrátu důvěry konkrétního zákazníka.
8. Typ tisku
Typ tisku v dokumentu také ovlivňuje míru přesnosti vytěování. Obecně platí, e strojově titěná pole mají nejvyí míru přesnosti, následují ručně psaná tiskací písmena a na závěr text psaný. U strojového tisku ovlivňuje přesnost vytěování také font pouitého písma a mezery mezi znaky. OCR nástroj opravdu porovnává skladbu jednotlivých teček (pamatujte na DPI = rozliení) v samotném znaku získaném z dokumentu oproti své vzorové databázi znaků. I samotný typ jazyka ovlivňuje míru přesnosti zpracování. Z praxe plyne, e nejpřesnějí bývají pro zpracování jazyky zaloené na latince.
9. Čárové kódy a zakrtávací pole
Čárové kódy a zakrtávací pole obvykle vykazují nejvyí přesnost vytěování v dokumentu. Není neobvyklé, e se řeení pro automatizaci zpracování dokumentů chlubí přesností přes 90% pro vytěení hodnoty čárových kódů a vytěení zakrtávacích polí. Pouívají se desítky typů čárových kódů, včetně 1D, 2D a nyní i 3D čárových kódů (2D s barvou). Ujistěte se, e nově zvolené řeení pro automatizaci zpracování dokumentů podporuje ty nejčastěji se vyskytující.
10. Podpisy
Jedním z hlavních důvodů, proč je stále pro mnoho dokumentů zdrojem papír, je poadavek na podpis konkrétního dokumentu. Zamyslete se, zda jsou ve vaí společnosti typy dokumentů, které by bylo moné vytvářet pouze elektronicky nebo podepisovat pomocí elektronického podpisu. Pokud dokáete u daného typu dokumentu určit, zda pro povahu dokumentu postačuje samotná přítomnost podpisu nebo zda potřebujete podpis snímaný s budoucí moností odhalení zfalování a podvodu, pak lze implementací softwaru pro biometrické vytváření elektronického podpisu zvýit celkovou produktivitu uivatelů a tím i celkovou automatizaci zpracování dokumentů.
11. Databáze
Klasifikaci a přesnost vytěování obsahu výrazně zlepí vyuití různých databází. Při shodě s podobným obsahem v databázích lze vyřeit automaticky drobné chyby OCR. Výsledek? Mení zapojení lidí do procesu opravy výsledků OCR vytěování. Obsah databáze často zahrnuje jména zákazníků, čísla účtů, číselníky, seznamy zaměstnanců nebo dodavatelů, čísla objednávek, nákladových středisek, různé slovníky pro specifická průmyslová odvětví a mnoho dalího.
12. Pravidla
Dalím tipem, který umoní vyí přesnost zpracování, jsou pravidla. Například kontrola, e mezisoučet plus daň se rovná součtu, je jednoduché pravidlo, které kontroluje chybu vytěení nebo i samotného uivatele, pokud v daném poli přepíe hodnotu a udělá chybu. Zároveň kontroluje data na zaslaném účetním dokladu, zda sazba daně odpovídá konkrétní státní legislativě dokladu. Moderní systémy dokáou nad kadým vytěeným polem spustit definovanou kontrolu. Dalí často vyuívanou je formátování, kdy cílové systémy očekávají určitý formát a je potřeba korigovat, by správně vytěená, data z dokumentu. Datum je zde klasickým případem. Bankovní účty vyuívají pravidla modulo pro správnost samotného účtu. Různé kontrolní součty dokáí automatizovat celé zpracování a urychlit i následující proces, týkající se například schvalování. Pokud systém sám propočítá a ověří data proti databázi, např. ERP systému, pak nemusíme dokument poutět do schvalovacího kolečka a lze jej umístit rovnou do kroku zaúčtování/proplacení.
13. Cílové systémy
Řeení pro automatizaci zpracování dokumentů nejsou kompletní bez snadného způsobu odesílání dokumentů a dat do navazujících systémů, procesů a k lidem, kteří je potřebují. Produktivita uivatelů padá výrazně dolů, pokud jsou nuceni ručně přesouvat dokumenty nebo data mezi systémy. Tento úkol je jedním z typických příkladů zapojení robota do celkové automatizace a propojení RPA a CDA technologie. Robot s minimálním úsilím pro implementaci dokáe snadno přesouvat, integrovat a agregovat data mezi systémy. RPA technologie, obsahující uvnitř řeení pro automatizaci zpracování dokumentů, pak dokáe pokrýt celý proces zpracování včetně integrace tam, kde není k dispozici existující softwarové propojení systémů.
Přítě
V posledním díle se podíváme za samotné hranice technologií RPA a CDA a zaměříme se na celkový pohled na transformaci celkových obchodních a firemních procesů a s tím spojených operativních kroků.
Kontakt
INFOMATIC s.r.o.
solutions@infomatic.cz
https://www.infomatic.cz
![]() |
Tomá Dolej Autor článku je ředitelem společnosti INFOMATIC. |
Formulář pro přidání akce











