facebook LinkedIN LinkedIN - follow
IT SYSTEM 9/2000

Datové sklady nejen pro vrcholový management

Pavel Seibert





Pojem datový sklad se během posledních několika let nesmazatelně zabydlel v povědomí uživatelů informačních systémů (IS). Datový sklad je správně chápán jako nezbytná nadstavba provozních IS, pomocí které pracovníci firemního managementu snadno a rychle získávají ve velmi přehledné podobě informace pro sumární analýzu dat, odhalování skrytých souvislostí, sledování trendů v různých oblastech apod. Postupem doby se však ukazuje, že využití dobře navrženého datového skladu není třeba vázat pouze na pracovníky vrcholového managementu. Cílem tohoto článku je přiblížit možnosti využití datových skladů i dalšími okruhy uživatelů mimo vrcholový management, a to zcela obecně v různých odděleních firem a na různých úrovních.

Historie
V rámci provozních IS jsou v současné době ve většině podniků spravovány více či méně rozsáhlé databáze. Pro tyto databáze lze, v podstatě bez ohledu na typ firmy, najít některé společné rysy:

· databáze bývají často velmi rozsáhlé
· struktura je optimalizována na transakční způsob zpracování v reálném čase
· historická data bývají archivována odděleně od dat provozních
· historická data jsou často "on line" nedostupná
· v podnicích často existují různorodá data z období provozování různých IS

Pro prezentaci takto spravovaných prvotních dat jsou v různých IS k dispozici různé prostředky v podobě výstupních sestav či reportovacích nástrojů. Jejich společným rysem je to, že požadované údaje získávají z provozní databáze. To způsobuje, že vstupní údaje pro požadované výstupy mohou být obtížně dostupné a jejich získání ve formě různých reportů se stává problematickou záležitostí.

Problematičnost spočívá zejména v době zpracování výstupů (desítky minut, hodiny) a v jejich rozsahu (dlouhé výstupní sestavy). Častým případem je i to, že požadované výstupy nelze z technických důvodů pořídit snadným způsobem vůbec (data z různých IS, archivovaná data). Lze jistě namítnout, že i tato situace je řešitelná standardními prostředky (naplnění příslušných dat např. do MS Excel). To je jistě pravda. Velmi těžko však lze pak splnit jeden ze základních požadavků na funkci IS - poskytnout uživateli požadovanou informaci v přijatelném čase a bez nutnosti dalších činností (např. právě plnění dat do MS Excel). Hranicí pro "přijatelný čas" se stále častěji rozumí pro jednodušší dotazy či malé objemy dat v podstatě okamžitá odezva, pro složitější či objemnější dotazy nejvýše 3 minuty.

Datové sklady
Převážnou část výše uvedených úskalí lze odstranit využitím datových skladů. Základní podmínkou je, aby struktura dat uložených v datovém skladu toto využití co nejvíce podporovala.

Data v datovém skladu
Uložení dat v datovém skladu se v porovnání s ukládáním dat v provozních IS řídí poněkud odlišnými pravidly. Hlavním důvodem je, že v datovém skladu je třeba mít k dispozici data vyčištěná a také co do struktury uložená jinak než v provozním IS. Zdánlivým paradoxem je, že objem dat, uložených v datovém skladu, může být i podstatně větší než v prostředí provozního IS. Díky stavu na poli HW se tato skutečnost postupně stává méně závažnou a do popředí vystupují přínosy, které toto navýšení poskytuje. V následujících částech popíšeme přínosy řešení formou datového skladu.

Primární databáze
Na úrovni datového skladu je výhodné mít k dispozici primární databázi. Údaje v této primární databázi jsou do značné míry shodné s daty v databázi provozních IS. Pro vytvoření primární databáze vede několik závažných důvodů:

· do primární databáze jsou ukládána data vyčištěná a plně verifikovaná
· ukládaná data mohou pocházet z různých IS (sjednocení zdrojů)
· do primární databáze mohou být ukládána i historická data
· vytvořením primární databáze je v prostředí datových skladů k dispozici potřebná detailní úroveň informace
· primární databáze může být provozována v odlišném prostředí (server, databázový stroj) než databáze provozního IS
· převážná většina činností nad primární databází v datovém skladu nezatěžuje databázi provozního IS
· aktualizace primární databáze se provádí v době minimálního zatížení provozního IS
· aktualizace primární databáze se provádí s minimální účastí uživatele (řešení nejednoznačných či chybových stavů)

Vytvořením primární databáze tak získáme v datovém skladu jednotnou datovou základnu pro další využití.

Struktura datového skladu
Pro vytvoření vlastního datového skladu je třeba navrhnout odpovídající datovou strukturu. Návrh struktury je záležitostí zásadního významu - kvalita návrhu následně přímo podmiňuje funkčnost vlastního datového skladu.

Je zřejmé, že struktura datového skladu, návrh tabulek dimenzí a faktů, definice počítaných položek a celá řada dalších činností, spojených s tvorbou vlastního datového skladu, je vždy opřena o kvalitní analýzu řešené problematiky u konkrétního uživatele. Toto ve zvýšené míře platí pro případ, kdy uvažujeme o širším využití datového skladu. Podstatnou částí výše zmíněné analýzy se tak stává i analýza provozovaných aplikací, poskytujících například výstupní sestavy, a reportovacích nástrojů. Cíle této analýzy lze rozdělit v zásadě do dvou skupin.

1) Analýza požadovaných funkcí
V rámci téměř všech rutinně provozovaných IS se časem ukáže, že některé části, zejména v oblasti realizovaných výstupů, se používají více, některé méně, některé případně vůbec. Stejně tak v provozovaných částech se mnohdy vyskytne potřeba provést určité změny, k jejichž realizaci doposud nedošlo. Z těchto důvodů je vhodné provést následující kroky:

· určit společně s uživatelem skutečně používané činnosti (výstupní sestavy apod.)
· v určených činnostech dohodnout provedení případných změn
· vytipovat a navrhnout funkce (příklady výstupních sestav apod.), které nebylo možné ve stávajícím systému realizovat
Výsledkem tohoto snažení je získání takových údajů, které je třeba zanést do řídících datových struktur datového skladu.

2) Návrh struktur datového skladu
Údaje získané při analýze požadovaných funkcí je třeba odpovídajícím způsobem zanést do datových struktur. V případě již provozovaného datového skladu to znamená jak jejich rozšíření na úrovni dimenzionálních (v podstatě číselníkových) údajů, tak i doplnění či úpravu těch částí, které zajišťují plnění příslušných datových struktur (datové pumpy). Při vytváření nově vznikajícího datového skladu je třeba zohlednit dané skutečnosti od samého počátku. Dodržením uvedeného postupu bude zajištěno, že výše zmíněné funkce budou v rámci datového skladu plně podporovány.

Plnění datového skladu
Vlastní plnění datového skladu je činnost koncovému uživateli skrytá, avšak o to závažnější. Plnění datového skladu lze rozdělit na dvě části - prvopočáteční naplnění a pravidelnou (přírůstkovou) aktualizaci.

1) Prvopočáteční naplnění
Při prvopočátečním naplnění se do datového skladu ukládají provozní údaje z rutinně provozovaného IS, případně archivovaná data historická či převzatá z jiných dříve provozovaných IS. Tato činnost bývá časově poměrně náročná a zejména v počáteční fázi je nutná maximální pozornost jak při plnění, tak poté při ověřování správnosti naplnění údajů.

2) Pravidelná aktualizace
Při aktualizaci dat v datovém skladu se provádí už "pouze" plnění přírůstků dat. Toto plnění by již při správné realizaci nemělo ze strany uživatele vyžadovat zvýšené nároky na činnost. Funkce je vhodným způsobem žurnálována tak, aby bylo zřejmé, jaké údaje, kdy a kým byly zpracovány, a zejména je nutno podchytit výskyt případných chybových či jinak problematických údajů pro jejich následnou kontrolu a zpracování.

Agregace dat
V agregovaných datových strukturách jsou údaje uloženy takovým způsobem, který umožňuje jejich rychlé zpřístupnění z různých úhlů pohledu. Právě v existenci agregovaných dat je principiální odlišnost uložení ve srovnání se standardním IS. Stupeň agregace je definován v řídících datových strukturách datového skladu.

Způsob a stupeň agregace v konkrétním datovém skladu jsou opět výsledkem podrobné analýzy konkrétního řešení. Vlastní plnění agregovaných dat se provádí pomocí příslušných funkcí, které jsou spouštěny bez účasti koncového uživatele. Případné změny či rozšíření agregací zadává určený uživatel (zpravidla administrátor systému).

Prezentace dat
Při prezentaci spravovaných údajů se zřejmě setkáme z pohledu uživatele s největšími změnami. Právě na nás - dodavateli řešení - bude nejvíce záležet, zda tyto změny budou vnímány jako podstatný přínos a vylepšení funkce systému jako celku. K dosažení tohoto cíle se opět nabízí několik osvědčených řešení.

Volba prezentačního nástroje
V současné době je k dispozici celá řada prezentačních nástrojů, které lze použít pro prezentaci dat, spravovaných v prostředí datového skladu. Jednotlivé nástroje poskytují značně podobné základní funkce. Hlavní odlišnosti pak spočívají v bohatosti nabídky dalších rozšiřujících funkcí a samozřejmě v ceně. Je výhodné, když se podaří zvolit takový nástroj, který je uživateli co nejbližší a se kterým se dokáže co nejdříve sblížit natolik, aby dokázal efektivně využívat jeho možností. Po tomto prvotním seznámení se s kvalitativně novým prostředím je možné přistoupit ke zvládání dalších funkcí či zvolit nástroj, který dokáže pokrýt i požadavky uživatelem nově požadované. Je totiž poměrně běžný úkaz, že po počáteční nedůvěře přijde uživatel novému prostředí "na chuť" a sám se stane velmi aktivním spolutvůrcem realizovaného řešení.

Nabídka funkcí/reportů
Ve stávajících systémech je uživatel velmi často zvyklý na takový způsob práce, kdy se mu nabízí ve formě seznamu omezená množina funkcí, které ke své činnosti potřebuje. Ponechat uživatele napospas hledání v labyrintu velmi bohatých možností nově pojatého řešení je záležitost problematická. Nic však nebrání tomu, aby i v novém prostředí měl uživatel připravenu podobnou nabídku třeba i se stejnými názvy funkcí. Je také na místě zvážit možnost pokrytí požadavků na funkce tak, aby se jejich ovládání i obsah podobal řešením, na které je uživatel zvyklý ze stávajícího systému. Po seznámení se s novým prostředím uživatel brzy ocení jeho výhody a samostatně či po krátkém zaškolení začne nových možností využívat.

Podpora stávajícího způsobu zpracování
Jednou z běžných funkcí, která je podporována ve většině prezentačních nástrojů, je výstup vybraných a uspořádaných údajů do prostředí např. tabulkových procesorů (typicky MS Excel, případně jiné). Je obvyklé, že uživatel byl ve stávajícím způsobu zpracování údajů zvyklý mít ve zvoleném prostředí (např. MS Excel) určité údaje pro další zpracování. Je vhodné mu tuto možnost ponechat k dispozici i nadále, avšak náležitě vylepšenou. Vylepšení spočívá zejména v tom, že není nutno, aby si on sám či někdo jiný data do zvoleného prostředí dodatečně zadával, ale přenos se uskuteční prostřednictvím exportu z prostředí prezentačního nástroje automatizovaně. Po bližším seznámení s možnostmi prezentačního nástroje se pak ukáže, zda je nutno tento způsob zpracování ponechat v provozu i nadále, či zda je možno požadované funkce realizovat přímo v prostředí prezentačního nástroje.

Důležitým faktorem může být i to, že určité funkce lze v prostředí prezentačního nástroje realizovat obtížněji, případně (v závislosti na použitém prezentačním nástroji) je nelze realizovat vůbec. Potom je zřejmé, že výše popsaný přenos zůstane aktuální i nadále, samozřejmě s již uvedeným vylepšením (automatizovaný přenos údajů).

Dalším důvodem může být skutečnost, že je potřeba mít například určité výstupy právě v příslušném formátu (MS Excel či jiný) pro předávání dalším pracovníkům či složkám, které buď nemají k dispozici používaný prezentační nástroj nebo odlišný formát přímo vyžadují.

Přístupová práva
Pomocí přístupových práv je možno nastavit přístupy jednotlivých uživatelů nebo jejich skupin k funkcím a datům. V rámci provozovaného datového skladu je možné nastavit pro zvolené skupiny uživatelů či jednotlivé uživatele přístup pouze k určeným údajům. Tímto způsobem lze zajistit požadovanou úroveň bezpečnosti tak, jak to vyžadují provozní a organizační poměry u konkrétního zákazníka.

Datové sklady nejen pro vrcholový management
V této části se zmíníme o nejvýznačnějších přínosech, které řešení formou datového skladu přinese uživatelům mimo vrcholový management. Máme tím na mysli zejména tu část uživatelů, pro které byly ve stávajících IS určeny rozličné výstupní sestavy a přehledy. Při rozšířeném využití datových skladů budou mít tito uživatelé možnost ocenit zejména následující skutečnosti:

· Snadná a rychlá dostupnost informace
· Ve srovnání se standardními výstupy v prostředí provozního IS dostane uživatel u kritických výstupů požadovanou informaci ve zlomkovém čase. Navíc u takto získané informace má možnost využít dalších funkcí (drill down, drill up, drill across, porovnávání apod.), které by při standardním způsobu zpracování byly uskutečnitelné pouze obtížně, částečně anebo vůbec.
· Podpora grafického výstupu
· Uživatel má k dispozici požadovanou informaci jak v podobě číselné tabulky, tak i ve vybrané grafické podobě. Grafickou podobu má k dispozici přímo v prostředí prezentačního nástroje bez nutnosti přenášení údajů do prostředí, které zobrazení formou grafů podporuje.
· Samostatné provádění úprav v existujících přehledech

V předem připravených přehledech má uživatel možnost provádět celou řadu úprav jak ve smyslu uspořádání získané informace, tak ve smyslu změn výběrových kriterií. Díky odlišnému způsobu uložení dat v datovém skladu se u podstatné části takovýchto úprav nemusí provádět opakované vyhledávání údajů. Avšak i při opakovaném vyhledávání je požadovaná informace k dispozici neporovnatelně rychleji (viz výše).

Samostatné vytváření nových přehledů
Na základě existujících přehledů nebo s využitím možností prezentačního nástroje si může uživatel velice snadno a rychle definovat výstupy podle svých představ. Není přitom omezen časově zdlouhavým definováním svých požadavků a čekáním na to, až budou jeho požadavky někým jiným zrealizovány. Interaktivní formou má možnost v podstatě modelovat formu a obsah požadovaných výstupů a vytvořené produkty si uložit pro další použití.

Otevřenost řešení
Otevřenost řešení s použitím datového skladu je jednou z nejdůležitějších vlastností nového přístupu. Otevřenost je možno chápat z více hledisek. Například otevřenost ve smyslu volné přístupnosti údajů ze všech úhlů pohledu v souladu s navrženou datovou strukturou datového skladu nebo otevřenost z hlediska disponibilních dat (provozní, historická, z jiných IS) v souladu s tím, jak jsou do navržených datových struktur naplněna.

Přístupnost z prostředí Internetu
Vybrané údaje je možno snadno uložit ve formátu přístupném pro prohlížení z prostředí internetu. Toto uložení je vesměs podporováno v rámci použitých prezentačních nástrojů. V závislosti na typu či konfiguraci prezentačního nástroje je možno mít uloženu jak pasivní, tak i aktivní aplikaci (podporující provádění řady úprav i v prostředí internetu).

Shrnutí
Rozhodně nebylo účelem tohoto článku degradovat řešení formou datového skladu na přímou náhradu určitých funkcí provozního IS. Datový sklad je samozřejmě i nadále v první řadě určen pro potřeby managementu a podporu rozhodování ve firmě. Snažili jsme se pouze doložit tu skutečnost, že odpovídajícím návrhem a realizací modelu datového skladu jej lze velmi výhodně využít i pro pokrytí těch funkcí, kde to v nedávné minulosti z různých důvodů (kapacitní, cenové, neexistence potřebných produktů atd.) bylo prakticky nemožné.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

7 vlastností ERP systému, které dělají uživatelům radost

Kdy je ovládání ERP systému poho­dl­né? Když mohou jeho uživatelé snadno a efektivně pracovat s potřebnými funkcemi a informacemi bez zbytečných obtíží. Tím se zvýší produktivita jejich práce, omezí se chybovost a firma poroste.