facebook LinkedIN LinkedIN - follow
IT SYSTEMS 4/2016 , DMS/ECM - Správa dokumentů

Moderní digitalizace dokumentů aneb Skenováním to teprve začíná



UnicornNajít dnes společnost, která nepracuje s žádnými dokumenty, by bylo velmi těžké, ne-li nemožné. Některé musí denně zpracovat stovky, i tisíce dokumentů různého účelu a důležitosti. Ačkoli jsou již na trhu dostupné technologie pro elektronickou výměnu dat (EDI), tak řada společností většinu dokumentů zpracovává v papírové podobě. Častým příkladem jsou faktury, dodací či nákladní listy. Pokud společnost pracuje pouze s papírovou podobou dokumentů, musí často vyvíjet nemalé úsilí pro jejich zpracování a následné systematické uložení.


I přes vynaložené úsilí má práce s papírovými dokumenty řadu omezení. Je často nutné mít fyzický archiv dokumentů, aby je bylo možné v případě potřeby najít. Ale i tak je vyhledání dokumentu, pokud jich firma zpracovává vyšší počty, obvykle časově náročné. O nějakém řízeném zpracování a historii tohoto zpracování typu schválení dodavatelských faktur ani nemluvě. V řadě společností je možné i dnes vidět papírové košilky faktur, do kterých jsou ručně vpisována data pro jejich schválení.

Zavedení moderní digitalizace dokumentů je osvobozením od stohů papíru a tlustých šanonů. Digitalizace zajistí převod papíru do elektronické podoby hned po jeho přijetí. Ve většině případů pak již společnost dále pracuje pouze s digitální podobou daného dokumentu a s papírem se již vůbec nemusí trápit. Moderní převod papíru do digitální podoby ale rozhodně neznamená jen naskenování dokumentu na dnes typicky využívaných multifunkčních zařízeních a následné uložení do složky na disku.

Na počátku je dokumentový skener a jeho software

Moderní digitalizace dokumentů stojí na specializovaných dokumentových skenerech, které nezaskočí velké počty dokumentů k rychlému naskenování, a to ani v případě, že jsou některé dokumenty k sobě sešité, případně jsou k dispozici v nezvyklých formátech. Tyto skenery jsou schopny zpracovat desítky, i stovky dokumentů za jedinou minutu. Dokumentový skener je ovšem jen základ. Dalším nezbytným článkem v digitalizačním řešení je software pro řízení a optimalizaci digitalizace dokumentů. Tento software dokáže z počítače určeného k digitalizaci (typicky podatelna) pohodlně konfigurovat a spouštět úlohy skenování. Důležitým přínosem je také zajištění optimalizace skenovaného obrazu dokumentu. Pomocí optimalizace lze dosáhnout až několikanásobného zmenšení velikosti souboru digitalizovaného dokumentu, zvýšení kontrastu a čitelnosti obsahu dokumentu, což ocení nejen případní čtenáři dokumentu, ale i nástroje pro následné vytěžování obsahu.

Vytěžování obsahu dokumentů

Vytěžování obsahu dokumentů – OCR posouvá digitalizaci dokumentů do dalšího rozměru. Díky vytěžení lze provést indexaci dokumentu bez nutnosti manuálního přepisu údajů z dokumentu do indexu. Pro další zpracování a snadné vyhledání je pořízení indexu (metadat) k dokumentu zcela zásadní. Řešení pro tvorbu indexu pomocí vytěžování obsahu může mít několik podob. Základní řešení nabízejí takzvané zonální OCR, kdy je nutné definovat zóny dokumentu pro konkrétní položky indexu. Pracovník provádějící například digitalizaci faktur tak typicky u každého dokumentu tvoří jeho index tím, že jen vyznačuje zóny, kde je variabilní symbol, IČ dodavatele, částka a další položky indexu, které pro své faktury potřebuje získat. Toto řešení má samozřejmě své limity a je dobře použitelné jen v případě zpracování menšího počtu dokumentů, protože vyžaduje jistou manuální činnost pracovníků. 

Unicorn

Toto úsilí pomáhají do velké míry zmenšit řešení s podporou šablon vytěžovaných dokumentů. V těchto řešeních je možné pak definovat například pro fakturu od každého dodavatele šablonu, kde jsou určeny zóny pro jednotlivé položky indexu. Tímto přístupem lze v případě dostatečné připravenosti šablon pro digitalizované dokumenty proces vytěžení značně automatizovat. OCR řešení pak pro známé dokumenty pořizuje index automaticky, bez činnosti uživatele. V případě, že narazí na dokument, pro který nedokáže určit správnou šablonu nebo není schopen dle zvolené šablony potřebná data vytěžit v požadované kvalitě, je tento dokument určen k verifikaci. Verifikaci pak manuálně provádí pracovníci na verifikačních stanicích, kde tyto dokumenty ověří a případně manuálně dokončí či napraví provedenou automatickou indexaci. Moderní řešení se již umí také z provedených verifikací učit, takže pokud příště bude zpracováván obdobný dokument, řešení jej plně automaticky zpracuje bez nutnosti verifikace.

Nejvíce pokročilá řešení pro vytěžování dokumentů jdou ale ještě dále a nezůstávají pouze u šablon a případného učení se drobných obměn pro danou šablonu. Tato řešení vykonávají takzvané inteligentní vytěžování, které spočívá v analýze obsahu dokumentu, vyhledávání klíčových slov a automatickém určení zón pro vytěžení dat. Tyto typy řešení jsou tak schopny vyhledat například slovo, variabilní symbol nebo zkratku VS a v jeho okolí číslo reprezentující hodnotu variabilního symbolu, ať se variabilní symbol nachází v jakékoli části dokumentu. I u těchto řešení se však nelze vyhnout nutnosti občasné manuální verifikace vytěžených dat, avšak praxe dokazuje, že úspěšnost algoritmů inteligentního vytěžování je relativně vysoká. Úspěšnost vytěžování vždy silně závisí na správném nastavení systému a čitelnosti vstupních papírových dokumentů. Architektura pokročilejších řešení pro zajištění vytěžení dat je v drtivé většině typu klient-server. Server v řešení vykonává úlohy automatizovaného vytěžování a případných integrací na okolní systémy. Integrace na okolní systémy společnosti je zde často z důvodu validací některých vytěžených dat oproti primárním, kmenovým datům, která jsou uložena typicky v ERP systému. Server provádějící vytěžování tak dokáže například automaticky kontrolovat, zda vytěžené IČ dodavatele na faktuře existuje v seznamu evidovaných dodavatelů. Pokud existuje, může rovnou do indexu dokumentu přidat další údaje o dodavateli z primárních dat. Pokud záznam o dodavateli není nalezen, bude tento dokument určen k manuální verifikaci. Verifikace je jednou z hlavních úloh klientských stanic digitalizačního řešení. Těchto stanic může být v rámci společnosti hned několik, zapojením hned několika paralelních pracovníků se proces případných verifikací urychlí.

Systém uchování dokumentů - elektronický archiv

Po provedení komplexní digitalizace dokumentu a vytěžení potřebných dat do strukturované podoby je třeba vyřešit otázku, kam elektronický dokument uložit. Pouhý souborový systém je nedostačující jak z hlediska bezpečnosti, tak z hlediska podporovaných funkcí pro vyhledání a systematickou práci s dokumenty. Správným řešením je využití specializovaného systému pro uchování dokumentů a práci s nimi – DMS (Document Management System) nebo také elektronický archiv. Tyto systémy již nabízejí komplexní zabezpečení – mohou využívat pokročilých metod autentizace uživatelů (například dvoufaktorovou autentizaci), řídit na detailní úrovni přístupová práva k jednotlivým dokumentům i složkám. Dokumenty jsou ukládány do bezpečné databáze, ve které lze auditovat jakoukoli operaci uživatele. Uložené dokumenty mohou být opatřeny i digitálními razítky od akreditované certifikační autority. Dokumenty opatřené těmito razítky pak splňují legislativní podmínky pro elektronickou archivaci a jsou, v případě styku se státními institucemi, plnohodnotnou náhradou papírové podoby.

Kromě bezpečného uložení nabídnou dnešní DMS systémy i bohaté možnosti vyhledávání, což je často při velkých objemech zpracovávaných dokumentů naprosto nezbytné. Do procesu vyhledávání je zahrnut jak vytěžený index dokumentu, tak obsah dokumentu pomocí full-textového vyhledávání. Díky této kombinaci pak například lze jednoduše vyhledat faktury od konkrétního dodavatele, které byly nad určitou částku, a navíc obsahovaly zadaná klíčová slova.

Přístup k dokumentům v rámci workflow

S dokumenty také často souvisí procesy, které jsou s nimi vykonávány. Velmi častým případem je schvalování faktur před jejich proplacením kompetentními osobami. I tyto procesy lze samozřejmě digitalizovat a daný proces zefektivnit. Díky uložení v DMS mohou k dokumentu přistoupit všichni, kdo mají dokument vidět a schválit. Dokumenty, které čekají na určitou akci pracovníka, není nutné složitě hledat. Naopak lze říci, že si tyto dokumenty najdou pracovníka samy, protože se mu automaticky zobrazí ve frontě jeho dokumentů ke zpracování. Samozřejmostí jsou e-mailové a další notifikace, které upozorní na nový dokument ke zpracování, aby pracovník například věděl, že na něj čeká nový dokument ke schválení. Pro jeho schválení může odkazem v e-mailu přejít rovnou k dotyčnému dokumentu, prohlédnout jej a rozhodnout o schválení, či zamítnutí. Některá řešení digitalizace procesů jdou tak daleko, že pracovník se ani nemusí hlásit do systému, protože součástí e-mailu je i kopie dokumentu a on může dokument schválit pouhou odpovědí na daný e-mail. To je velmi vhodné pro pracovníky, kteří jsou často v terénu a potřebují dokumenty schvalovat ze svého mobilního zařízení.

Shrnutí

Řešení digitalizace jsou dnes velmi komplexní a nezastavují se pouze u úkolu základního převodu papíru na elektronický dokument. Tato řešení mohou velmi zefektivnit chod společnosti, která je zavede.

Petr Puš Petr Puš
Autor článku je zkušeným softwarovým architektem a vývojářem. Specializuje se na vývojové platformy Microsoft .NET a Microsoft SharePoint, k nimž disponuje několika certifikáty společnosti Microsoft – MCP, MCAD, MCSD, MCT a MCTS. Vývoj na platformě .NET přednáší na vysoké škole Unicorn College a v minulosti vyučoval několik let vývoj moderních informačních systémů v .NET na Univerzitě Hradec Králové.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Konec papírování, digitalizujte a usnadněte si práci!

IT Systems 3/2024V aktuálním vydání IT Systems jsme se zaměřili na vývoj digitalizace ve světě peněz, tedy v oblasti finančnictví a pojišťovnictví. Dozvíte se například, proč je aktuální směrnice PSD2 v inovaci online bankovnictví krokem vedle a jak by její nedostatky měla napravit připravovaná PSD3. Hodně prostoru věnujeme také digitalizaci státní správy a veřejného sektoru, která nabírá obrátky.