facebook LinkedIN LinkedIN - follow
IT SYSTEMS 6/2012 , AI a Business Intelligence

IT řešení pro analýzy, plánování a reporting



Acrea Analýzy, plánování, reporting. Tři samostatné činnosti realizované různými odděleními za použití různých nástrojů, přístupů a metodologií. Kolektivy analytiků, data minerů, datových specialistů, IT odborníků a business uživatelů se snaží najít společnou řeč v tom, jak získat požadovaná data z různých datových zdrojů v požadovaném rozsahu a termínu. Často se stává, řečeno obrazně, že pravá ruka neví, co dělá levá – opakovaně se provádějí stejné datové operace, oddělení spolu vzájemně nekomunikují, nespolupracují, nesdílí výsledky. Společným jmenovatelem veškerých činností jsou však data a úlohou, před kterou stojíme, je, jak zajistit jejich dostupnost, aktuálnost a správný rozsah.


Samostatně, nebo centralizovaně

Jednotlivé procesy sice mohou být prováděny samostatně, ale mnohem efektivnější je práci s daty pro účely analýz a reportování sjednotit a zjednodušit. Celou řadu činností lze seřadit do logicky navazujících kroků, ETL procesů, jenž data zpřístupní z primárních systémů a provedou potřebné transformace a manipulace. Software, který by vytvořil jednotnou platformu pro spojování často heterogenních systémů, řídil přístup různých uživatelů k různým analytickým a datovým zdrojům, přebíral a předával řízení zpracování různých úloh, vytvářel reporty, informoval uživatele o provedených změnách, je přáním celé řady lidí, počínaje managementem společnosti, IT oddělením či analytiky a konče posledním uživatelem jednoduchého reportu.
Každá společnost má spoustu obchodních procesů, které chce zabezpečit, optimalizovat a zautomatizovat, v případě potřeby i auditovat. Na procesy je v rámci společnosti možno nahlížet ze čtyř různých perspektiv, z perspektivy obchodní, datové, analytické a technické. Příkladem mohou být pravidelné týdenní reporty, kdy zdánlivě jednoduchý proces představuje komplexní úlohu vyžadující spolupráci několika oddělení společnosti. IT oddělení zajišťuje datové zdroje, analytické oddělení je pomocí sofistikovaných nástrojů zpracovává. Poté je nad zpracovanými daty vytvořen report, který je nutno distribuovat správným uživatelům s patřičným oprávněním. Souhrnně lze říci, že se jedná o řízení navazujících procesů, jejich časové, eventuálně podmíněné spouštění, management a distribuci výstupů různým uživatelům a aplikacím.

Automatizace úloh

Velice často se jako ETL nástroj může použít dataminingový nástroj, který dokáže načíst data z různých datových formátů, provést s nimi požadované datové manipulace a transformace, vygenerovat nové proměnné a vyexportovat je zpět na databázový server. Výhodou těchto dataminingových softwarů je, že dokáží zpracovat tyto data do uživatelsky přijatelné formy datových posloupností operací, často nazývaných proudy. Těch může být celá řada pro různé datové oblasti.

Obr. 1: Znázornění statistického softwaru podporujícího „proudy“
Obr. 1: Znázornění statistického softwaru podporujícího „proudy“


K automatizaci spouštění těchto proudů pak mohou být využity prostředky operačního systému nebo jiné sofistikované nástroje pro automatizaci. Ty mají tu výhodu, že mohou zajistit i „administrativu“ spouštěných úloh. Tedy nejen jednoduché časování, ale také správu dalších důležitých informací o historii spouštění a zpracování úlohy jako celku, či jednotlivých dílčích úloh. Mohou se evidovat informace, kdy, kdo a s jakým výsledkem úlohu spustil. O zpracování úlohy se mohou zasílat notifikace.

Obr. 2: Příkladem administrativně automatizačního nástroje může být IBM SPSS Collaboration & Deployment Services
Obr. 2: Příkladem administrativně automatizačního nástroje může být IBM SPSS Collaboration & Deployment Services


Automatické spouštění procesů samozřejmě vyžaduje další specifická nastavení, nejen základní definici času, kdy a v jaké periodicitě se má úloha spouštět. Každý proces musí být vykonán nějakým aplikačním serverem a s uživatelským oprávněním konkrétního uživatele. Nástroj pro automatizaci procesů tedy nemůže být jenom „lepším“ časovačem, ale musí být komplexním nástrojem umožňujícím třeba i podmíněné spouštění úloh na základě nějaké vnější událost, například JMS zprávy, dále správu analytických aktiv, ETL úloh, šablon reportů apod. Analytickým aktivem může být například posloupnost datových operací, tzv. proud. Důležitá je i otevřenost systému. Není možno očekávat, že v rámci organizace budou všechny dílčí úlohy implementovány v jednom nástroji. Praxe je taková, že existuje celá řada SQL úloh pro ETL procesy, které nativně zpracovává databázový server, a celá řada analytických úloh, které zpracovávají různé analytické, statistické či dataminingové nástroje. Řešení musí být otevřeno všem těmto nástrojům a musí být schopno automatizovat jejich úlohy, ideálně v jednom rozhraní a s možností vzájemného propojení a návaznosti. Příkladem budiž automatizace úlohy, kdy proces začíná načtením a úpravou dat v databázi prostředky databázového serveru, následuje zpracování základních popisných statistik ve statistickém programu, dávkové off-line skórování záznamů v databázi pomocí dataminingového programu. Vše pak vyústí v generování reportu o výsledcích skórování, kategoriích, rizikových segmentech, cross/up sellových doporučení apod.
Software pro automatizaci musí dále umožňovat definici propojení na externí dataminingové, statistické, databázové a jiné aplikační servery. Musí umět řídit správu eventuálních výstupů ze zpracovávaných procesů a zajistit dostatečně sofistikovaný systém pro autentizaci a autorizaci uživatelů a dostatečně flexibilní nastavení oprávnění a funkcionality těmto uživatelům.

Data mining a reportování

Zdánlivě jednoduché „business non-critical“ reportování nejsou jen vizuálně líbivé manažerské reporty. Je to hlavně spousta dřiny v pozadí, kdy je třeba požadovanou informaci často „vydolovat“, případně přímo vygenerovat z různých datových zdrojů. Informace jsou v „neprezentovatelné“ formě, v různé granularitě, v různých transakčních systémech, v zákaznických CRM a jiných produkčních systémech. Samotný report je potom pouhou špičkou ledovce, tvořenou hezkým grafem či tabulkou. Reportovací nástroj s příjemným rozhraním a obsluhou, hezkými grafy a možnostmi exportu do Wordu či PowerPointu je sice krásná věc, ale všechny nástroje, aby měly co reportovat, potřebují data. Cesta ke správné informaci je nezřídka trnitá a komplikovaná, vede přes různé transformace, agregace a jiné datové manipulace. Často se postupuje tak, že se vytváří speciální datová matice nebo datový sklad určený pro potřeby tvorby reportů. Využití dataminingových nástrojů pro definici ETL procesů se tady přímo nabízí. Není náhodou, že se dataminingové nástroje pro tyto úlohy také často využívají. Rozšiřuje se tak původně omezený okruh klasických uživatelů dataminingových nástrojů, kterými byli data mineři a analytici. Nově přibývají uživatelé z marketingu, controlingu, auditu. S měnícím se zaměřením uživatelů se mění i požadavky na používaný software. Pro tyto nové uživatele nebývá hlavním kritériem počet a přesnost dataminingových algoritmů různých regresí, sítí a stromů, ale jednoduchost, uživatelská přívětivost a vizuální pochopitelnost celého procesu přípravy dat pro reportování.

Aplikační synergie

Spojení různých nástrojů – dataminingových, administrativních, reportovacích – nabízí řešení pro správu komplexních procesů, jehož výsledkem může být jednoduchý graf či tabulka, na základě které se nejvyšší management společnosti může v kritických okamžicích rozhodnout. Takové řešení dokáže spravovat a řídit kritické procesy společnosti. Kooperace různých aplikačních serverů bude jednodušší, snazší bude také zpřístupnění vybraných datových zdrojů, analytických aktiv a reportů různým uživatelům na základě jejich oprávnění. To, co v současné situaci potřebujeme, je řešení stojící na pomezí mezi obchodem a IT, kterému budou rozumět oba tábory, často hovořící odlišným jazykem.

Libor Šlik
Autor je analytikem společnosti Acrea CR.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Konec papírování, digitalizujte a usnadněte si práci!

IT Systems 3/2024V aktuálním vydání IT Systems jsme se zaměřili na vývoj digitalizace ve světě peněz, tedy v oblasti finančnictví a pojišťovnictví. Dozvíte se například, proč je aktuální směrnice PSD2 v inovaci online bankovnictví krokem vedle a jak by její nedostatky měla napravit připravovaná PSD3. Hodně prostoru věnujeme také digitalizaci státní správy a veřejného sektoru, která nabírá obrátky.