facebook LinkedIN LinkedIN - follow
IT SYSTEMS 3/2022 , DMS/ECM - Správa dokumentů

Skenováním digitalizace nekončí

Ing. Petr Polanský


Skenováním digitalizace nekončí, ale začíná. Pojmy digitalizace a skenování se často nerozlišují a považují se za totožné termíny. Ve skutečnosti je ale skenování  pouze prvním krokem k dalšímu zpracování dokumentu. I když se tedy často hovoří o digitalizaci dokumentů, smyslem není pouze dokumenty digitalizovat (nafotit/naskenovat), ale připravit je tak, aby s nimi bylo mož­né následně pracovat v systému DMS (Document Management System). Digitalizace je pak komplexní proces zpracování dokumentů od naskenování fyzického dokumentu, přes vytě­že­ní, pojmenování, opatření metadaty až po export do DMS.


Jak celý proces digitalizace probíhá, je různorodé. Záleží na dokumentech, které digitalizujeme, a zda digitalizujeme pravidelně, nebo jednorázově větší množství starších dokumentů. Z hlediska typů dokumentů rozlišujeme dokumenty firemní (zpravidla archivy plné šanonů), velkoformátové (výkresy, stavební dokumentace) nebo knihy. Digitalizace knih je mimochodem velmi specifická výběrem vhodného knižního skeneru s kolébkou, která se přizpůsobí hřbetu knihy. Také následný proces zpracování dat je obvykle náročnější. Na firemní dokumenty, které jsou předmětem tohoto článku, jsou zpravidla využity dokumentové skenery s podavačem nebo průtahové skenery pro velké formáty (např. výkresy).

Příprava a skenování

Typický postup digitalizace dokumentů začíná přípravou před skenováním, která zahrnuje převzetí fyzických dokumentů (šanony, složky, krabice…) a jejich roztřídění. Dokumenty se roztřídí a rozčlenění dle typu dokumentu a formátu. Součástí procesu je také rozešití a odstranění sponek. Skenování pak probíhá zpravidla hromadně na dokumentových velkokapacitních skenerech. Proto je vhodné dokumenty před naskenováním opatřit např. čárovým nebo QR kódem nebo vložením speciální oddělovací stránky s čárovým kódem, aby software automaticky sám dokumenty od sebe oddělil (tzv. automatická separace). Takto precizně připravená data před hromadným skenováním významně ulehčují celý proces. Dokumenty, které jsou poničené, se skenují samostatně „na skle“.

Dokumenty je důležité pojmenovat, zejména z hlediska budoucí manipulace s digitálním dokumentem např. pořadím, čárovým kódem nebo klíčovými informacemi, kde probíhá tzv. indexace (vyhledání klíčových slov v dokumentech). Jedná se např. o číslo výkresu, typ dokumentu, datum podpisu apod.

Tvorba metadat

Metadata obsahují všechny informace, které mohou být pro uživatele užitečné při další manipulaci se souborem. Metadata popisují dokument. Určují, o jaký typ sdělení se jedná v rámci evidenční karty a typu dokumentu. Např.: účetnictví – faktura vydaná, účetnictví ‒ faktura přijatá, smlouvy ‒ dodavatelská smlouva, zákaznická smlouva, objednávky ‒ objednávka přijatá, e-mail apod. Metadata vnáší do popisu dokumentu nový rozměr a dodají větší přehlednost při vyhledávání napříč archivem.

OCR vrstva nad dokumenty

Pro budoucí práci s digitalizovanými/digitálními dokumenty je vhodné tyto skeny opatřit tzv. OCR textovou vrstvou. K čemu OCR vrstva slouží? Díky ní je možné dokumenty procházet, prohledávat v textu dokumentu, jako kdyby PDF soubor byl původně vytvořen elektronicky. Software dokáže vyčíst text z naskenovaných dokumentů, který je možné využít např. při následném fulltextovém vyhledávání v celém digitálním archivu.

Dostáváte stále papírové faktury?

Pro papírové faktury je vhodné využít vytěžovací nástroje, které z faktur automaticky vyčtou potřebná metadata. Není třeba faktury ručně přepisovat. Ve zkratce to funguje tak, že systém projde přijatou fakturu, nalezne na ní klíčová slova, která jsou pro ERP systémy potřebná. Např. název dodavatele, IČ, číslo bankovního účtu, splatnost, částky apod. Uživatel (tzv. validátor) prochází jednotlivé faktury a pouze potvrdí na podnose připravená data, zda jsou v pořádku. Vytěžovací nástroje využívají křížové kontroly, číselníky jiných systémů a samy provádí validaci dat, zda dávají navzájem smysl. Na případné nejasnosti samy upozorní. Proč využívat vytěžování dat? Např. se zamezí chybovosti při ručním přepisu, upozorní na chybějící záznam a zkrátí se čas na zpracování. Vytěžování dat nahrazuje nekvalifikovanou práci kvalifikovaných lidí, kteří své schopnosti mohou věnovat jiným užitečným činnostem.

Posláním digitalizace je provést maximum operací před vložením naskenovaných dokumentů do systému DMS nebo elektronického archivu.

Přesun do DMS systému

S naskenovanými dokumenty lze následně aktivně a efektivně pracovat v rámci DMS systému, který přináší základní benefity ve formě přehlednosti, zabezpečení, přístupu, spolupráce a komfortního vyhledávání. Se zavedením DMS přichází na řadu i vlastní přehledná struktura centrálního úložiště dokumentů a dat organizace, a jasné a přehledné firemní procesy. DMS může být ideální možností, jak provést revoluci ve firemní transparentní kultuře, kterou budou všichni dodržovat.

S dokumenty lze následně digitálně pracovat

Jak už bylo řečeno, skenování je první fáze digitalizace. Pokud je doprovázena dalšími zmiňovanými kroky: roztříděním, indexací, pojmenováním a OCR vrstvou, můžeme s nimi dále efektivně pracovat v rámci DMS. Uveďme si nyní pár konkrétních příkladů s ohledem na naskenované dokumenty, které do DMS vkládáme:

  • Vyhledávání. DMS umí vyhledávat nejen v názvech a metadatech dokumentů, ale také v samotném textu dokumentů. Fulltextové vyhledávání prohledává vše: názvy, obsah textu, metadata… Právě proto je vhodné naskenované dokumenty opatřit OCR vrstvou (pokud DMS systém sám tuto funkčnost neumožňuje).
  • Provázanost. Jedna z vynikajících vlastností DMS je zajištění jednotnosti a provázanosti. Příklad: faktura přijatá se váže k objednávce nebo ke smlouvě. Všechny dokumenty jsou vzájemně propojené. Jeden odkazuje na druhý a naopak. Provázanost minimalizuje čas potřebný na hledání. Vše je přehledně uložené a vše se vším souvisí.
  • Workflow. Nad naskenovanými dokumenty mohou být spu­š­tě­ny (automatizovaně nebo různě) procesy, tzv. „workflow“. Proč? Např. na podatelnu přichází došlá pošta, která patří na určité oddělení, konkrétnímu člověku. Co udělá podatelna? Po naskenování (1. fáze digitalizace) nastaví oddělení, na které pošta patří, a skrze DMS odešle poštu. Na pozadí mohou být předem nastavené automatizované procesy, díky kterým se dokument dostane na správná místa ve správný čas.
  • Nástroje spolupráce. DMS je obvykle plný funkcí pro spolupráci nad elektronickými dokumenty. Jedná se o sdílení dokumentů, psaní poznámek a feedů, označení různých „lepítek“ nebo např. zvýraznění v PDF souboru. Při posílání přílohy e-mailu se doporučuje zasílat odkaz do DMS těm, kteří mají na dokument právo nahlížet, a to z důvodu, aby bylo zamezeno možnosti otevřít přílohu jinému příjemci (např. při neúmyslném odeslání přílohy).

Skenovat vlastními silami, nebo outsourcovat?

Zda skenovat fyzické dokumenty ve vlastní režii, nebo využít služeb dodavatele, je otázkou priorit každé organizace. Důležitou roli hraje, zda organizace skenuje pravidelně, nebo je třeba zpětně naskenovat větší množství dokumentů. V případě pravidelného skenování, každo­den­ní­ho, může organizace skenovat na vlastních skenerech. Pokud však je nutné naskenovat větší objemy dokumentů (stavební dokumentace, smlouvy, personální dokumenty, zdravotnická dokumentace apod.), je vhodné tuto službu outsourcovat. Důvodů je několik:

  1. Není nutné pořizovat vlastní skenery, často velkokapacitní dokumentové skenery, které pojmou tisíce dokumentů denně. Zároveň není nutné podstupovat servis a kalibrace skenerů.
  2. Není potřeba kupovat software, který dokumenty umí automaticky oříznout, pojmenovat a případně upravit kontrast apod. Pokud je vhodné využít OCR vrstvu, i zde je nutné vlastnit licence k potřebnému softwaru.
  3. Ušetří se pracovní síly těm, kteří by na digitalizaci museli mít vyčleněný čas. Není potřeba zaškolovat, platit mzdu a řešit dovolené. Digitalizace průměrného archivu může dle zkušeností trvat i 2–6 měsíců.
  4. Riziko za dobře provedenou digitalizaci je předáno na dodavatele. Dodavatel připraví data tak, aby byla optimálně digitalizována dle specifických požadavků pro přenos do DMS, ERP a jiných systémů.
  5. Využijete know-how odborníků, kteří se digitalizací zabývají na denní bázi a mají zkušenosti s mnoha podobnými digitalizacemi.

Elektronizace pomalu nahrazuje fyzické papíry. S takřka expo­nen­ci­ál­ním nárůstem datových schránek (více jak 1,4 milionu) a příchodem bankovní identity bude tento trend rozhodně pokračovat. Nicméně s fyzickými dokumenty se setkáváme dnes a denně a je vhodné s nimi efektivně pracovat. A jak digitalizujete dokumenty u vás?

Ing. Petr Polanský Ing. Petr Polanský
Autor článku je manažerem marketingu ve společnosti EXON.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.