facebook LinkedIN LinkedIN - follow
IT SYSTEMS 4/2020 , DMS/ECM - Správa dokumentů

Jak probíhá digitalizace dokumentů v praxi?

Viktor Mečiar, Júlia Ďurinová


TULIP SolutionsPři digitalizaci dokumentů hraje zásadní roli jejich kvalita, objem i typ. Důkazem mohou být dva projekty, které jsme v praxi realizovali a které jsou dokladem toho, že projekt digitalizace dokumentů je možné řešit opravdu různými způsoby. V první části se věnujeme digitalizaci faktur, v druhé pak HR agendě. Zároveň jde o dva různé přístupy k digitalizaci – pravidelný a jednorázový.


Příklad 1: Projekt pravidelné digitalizace faktur

Firma má více než 100 entit, ze kterých se pravidelně digitalizují prodejní i nákupní faktury. Nad každým dokumentem probíhá v zaměstnaneckém portálu elektronické schvalování. Objemově se jedná o více než 25 000 dokladů měsíčně. Všechny doklady přicházejí do skenovacího centra v různých nestrukturovaných formátech buď papírově, nebo elektronicky, nejčastěji ve formě PDF či strukturované ve formátu EDI. Skenovací centrum doklady digitalizuje, vytěží se z nich veškerá data včetně řádků. Protože se jedná o faktury, z jednoho dokladu se vytěžuje velké množství polí, tzv. indexů.

Na začátku spolupráce v roce 2014 tvořily většinu klientových digitalizovaných dokumentů papírové doklady. V takovém případě je třeba počítat s nezbytným roztříděním dokladů, jejich rozešitím i polepením čárovými kódy. Teprve pak přijde na řadu samotná digitalizace a vytěžení dokladu. Na tyto přípravné kroky se často zapomíná, ale právě ony tvoří výraznou část nákladů na vytěžování. Roztřídění dokumentů v nejvyšší možné míře ještě před digitalizací umožňuje větší rozsah automatizace vytěžení dat softwarem. Například roztřídění faktur na nákupní a prodejní nám umožní z faktury vyhledávat již přímo dodavatele. Pokud by byly faktury pomíchané, bylo by při vytěžování potřeba více manuálního doplňování dat.

Při přípravě digitalizace se zamyslete, jestli můžete ovlivnit kvalitu vstupních dokumentů. Mnozí dodavatelé vám mohou namísto papírových dokumentů posílat vygenerované PDF nebo přímo datové věty, které zkvalitňují a urychlují zpracování dokumentu – a to jak při skenování, tak při získávání dat z dokumentu.

Do digitalizace můžete skočit rovnýma nohama

Digitalizace ulehčuje vyhledávání a třídění dokumentů a je jednoduché vytvářet sestavy podle vytěžených metadat – parametrů. Tyto sestavy pak odhalují další možnosti zlepšování procesů. Například můžeme přijít na zvýšenou chybovost vytěžených dat u některých dodavatelů – může jít o nečitelný papírový dokument, který by mohl dodavatel zasílat i v jiné podobě – jako PDF nebo datovou větu (EDI, DBF…). Díky dostupným datům jsme při práci na tomto projektu zjistili, že některé dokumenty jsou zasílány duplicitně, po splatnosti a podobně. Digitalizace faktur a následné workflow můžou odhalit i další problémy, jako je opožděné schvalování faktur na některé z poboček a následné platby po splatnosti dodavatelům.

Obecně je tento projekt technicky náročný, vytěžovací maska je velmi komplexní s množstvím indexů, automatických kontrol a podobně. Také je potřeba dokumenty zpracovávat rychle a dodržovat termíny dohodnuté s klientem – každá doručená faktura musí být pro schvalovatele na portálu dostupná do 48 hodin od jejího obdržení.

Příklad 2. Jednorázová digitalizace velkého archivu HR dokumentů

Cílem projektu bylo jednorázově digitalizovat velké množství personálních dokumentů různých typů a formátů (pracovní smlouvy, dodatky ke smlouvám, rodné listy dětí, potvrzení o pobytu). Celkový objem dokumentů byl přibližně 50 000, což představovalo asi 150 000 stran. Společnost zaměstnává více než 7 000 zaměstnanců včetně cizinců. Cílem projektu bylo zpřístupnit na elektronickém portálu jednotlivým zaměstnancům jejich kompletně digitalizované složky tak, aby je měli kdykoliv k dispozici, bez potřeby kontaktu s HR oddělením. U tohoto projektu nebylo potřeba fulltextově vytěžovat a validovat velké množství polí, tzv. indexů, vytěžovali jsme jen několik indexů jako jméno, příjmení nebo datum narození. Důležité však bylo, aby tato pole byla opravdu správně vytěžena. Projekt nekončil jednorázovou digitalizací archivu. Pokračuje pravidelnou digitalizací na měsíční bázi, avšak přírůstek dokumentů není tak velký, jde přibližně o 1 000 nových dokumentů měsíčně.

Takový projekt se nejeví náročný z pohledu samotného zpracování – dokumenty jsou k dispozici, není potřeba digitalizovat je v průběhu krátkého časového rámce, na digitalizaci je čas několik měsíců.

Mimořádná bezpečnostní opatření a dočasné skenovací centrum

Jedním z prvních bodů projektu byla domluva, kde bude digitalizace probíhat. Vzhledem k tomu, že se jednalo o velké množství citlivých zaměstnaneckých dokumentů, nebylo žádoucí dokumenty převážet do našeho skenovacího centra. Tam bychom je sice naskenovali rychleji a komfortněji, ale spočítali jsme si, že přesun dokumentů by musel probíhat buď pravidelně, nebo bychom potřebovali pro převoz kamion. Riziko spojené s přesunem podobných dokumentů je příliš velké. Zvolili jsme tedy variantu skenování v prostorách zákazníka. Díky tomu jsme eliminovali riziko ztráty či znehodnocení dokumentů při přesunech, přišli jsme však o komfort a techniku našeho skenovacího centra. V prostorách zákazníka jsme tedy vybudovali dočasné skenovací centrum, ani to ale nebylo zrovna jednoduché. Šlo o prostor zhruba pro 5 osob, počítače, skenery, a zejména pro samotné zaměstnanecké složky. Klient navíc působí ve vícero budovách a městech. V neposlední řadě již pouhé zapojení počítače či skeneru do sítě a infrastruktury klienta není jednoduché, záleží na bezpečnostní politice. Nakonec se vše úspěšně podařilo, dočasné skenovací centrum jsme rozběhli a celá jednorázová digitalizace probíhala tam. Už na tomto příkladu je vidět, že pokud uvažujete o digitalizaci např. HR agendy, přípravná fáze projektu vám může zabrat klidně jeden či dva měsíce.

Během příprav skenovacího centra paralelně probíhaly softwarové úpravy nezbytné pro celý projekt, jako například vytěžovací maska pro jednotlivé typy dokladů nebo napojení na zaměstnanecký portál, abychom digitalizované dokumenty mohli do složek zaměstnanců automaticky nahrávat. Podepsaly se specifické NDA dokumenty, aby naši zaměstnanci mohli se zaměstnaneckými složkami pracovat, proběhla příprava na straně klienta. Ta spočívala v kontrole, třídění a finalizaci fyzických zaměstnaneckých složek. Po všech těchto přípravách proběhla samotná digitalizace.

Při procesu digitalizace se na úrovni složky určil zaměstnanec, kterému složka patří, a následně se ze složky naskenovaly veškeré dokumenty, z nichž se vytěžily relevantní indexy. Po digitalizaci se pak kompletní složka nahrála na zaměstnanecký portál do „elektronického šanonu“ zaměstnance. Složky se zaměstnancům po dobu digitalizace znepřístupnily; záměr byl zpřístupnit složky všem naráz po skončení digitalizace. Specifické byly nové dokumenty, které vznikaly během digitalizace archivu. Rozhodli jsme se, že tyto dokumenty naskenujeme zaměstnancům dodatečně po digitalizaci archivu, podle odhadů jich mělo být přibližně 1 000. Samotná digitalizace archivu proběhla víceméně bez závažnějších komplikací, avšak na závěr nás překvapil přírůstek dokumentů, které se nahromadily v jejím průběhu. Původní předpoklad 1 000 dokumentů se nakonec rozrostl na více než 3 500, což mělo za následek více času nutného ke zpracování tohoto „přírůstku“.

Vše se zvládlo a nastala předposlední fáze projektu, a to kontrola složek po nahrání na zaměstnanecký portál. Při ní se zjistilo, že navzdory našemu úsilí nebyly všechny složky před digitalizací správně roztříděny. Vyskytly se případy, kdy se dokumenty „Janka Mrkvičky“, narozeného 1. 4. 1978, nacházely ve složce „Janka Mrkvičky“, narozeného 23. 10. 1982. Poměrně hodně těchto nesrovnalostí souviselo s případnou změnou jména po svatbě a podobně. Nepodařilo se ani stoprocentně zabránit lidské chybě při validaci dokumentů. V celkovém poměru ke zpracovaným dokladům nešlo o velké množství; avšak i když 95 % dokumentů je v naprostém pořádku, u podobně citlivých údajů si nemůžete dovolit zpřístupnit dokumenty zaměstnancům. Začali jsme společně s klientem vymýšlet různé dodatečné kontroly, bohužel však žádný z návrhů zcela neodstranil riziko, že nějaký dokument nebude zařazen správně. Nakonec jsme toto dilema vyřešili změnou procesu v rámci zaměstnaneckého portálu.

Původně klient zamýšlel zpřístupnit elektronickou složku každému zaměstnanci tak, aby si ji mohl kdykoliv otevřít. Vzhledem k výše uvedenému riziku jsme proces upravili tak, že elektronické složky se nezveřejňují všem zaměstnancům automaticky, ale každý zaměstnanec si o složku musí elektronicky na zaměstnaneckém portálu zažádat. Tato elektronická žádost putuje na HR oddělení, které zaměstnaneckou složku před zveřejněním ještě jednou zkontroluje, a pokud je vše v pořádku, složku schválí a systém ji následně automaticky zaměstnanci zpřístupní. Nasadili jsme tedy dodatečnou kontrolu individuálních složek a minimalizovali tak riziko spojené s citlivostí obsažených údajů.

Co z toho všeho plyne?

Obě studie jsou příkladem úspěšné digitalizace bez zatajování problémových částí. Jak jste si mohli povšimnout, projekt digitalizace dokumentů je možné řešit opravdu různými způsoby, záleží na vašem očekávání, typu dokumentu, celkovém přístupu k digitalizaci a cíli, kterého je třeba dosáhnout. Ideální je poradit se předem s odborníky, kteří pro vás tuto službu budou zajišťovat.

Viktor Mečiar Viktor Mečiar
Autor článku je výkonný ředitel společnosti TULIP Solutions.
Júlia Ďurinová Júlia Ďurinová
Autorka článku je specialistkou společnosti TULIP Solutions.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.