facebook LinkedIN LinkedIN - follow
IT SYSTEM 4/2003

Business Intelligence I. díl:

Data->Information->Decision ->Knowledge

Tomáš Bárta





Business Intelligence se v blízké budoucnosti nevyhnutelně stane nedílnou součástí procesů každé společnosti, neboť ústředním tématem je koncepčně rozvíjet jedno z podceňovaných aktiv, a sice know-how. Proto jsme pro Vás připravili 4dílný seriál věnovaný této problematice, jehož cílem je představit celkovou problematiku Business Intelligence (BI). Rozsah seriálu umožňuje popsat pouze základní komponenty, prvky a myšlenky BI koncepce. V rámci tohoto dílu v úvodu představíme na konkrétním příkladu hlavní myšlenky a procesy BI řešení a poté se zaměříme na první kroky, které je nutné absolvovat při budování BI a sice sběru, transformace a historizace dat.

Business Intelligence - koncept
Podíváme-li se na klienta z pohledu bankovního systému, tak jak jej vidí pracovník na přepážce, můžeme zde obvykle vyhledat klienta dle jeho identifikace, dále si zobrazit přehled jeho běžných účtů a následně přejít na detail konkrétního účtu a přečíst výši bilance jeho účtu, nastavení tohoto účtu, případně zobrazit transakce které za poslední období provedl, opět pouze na tomto účtu. Jinými slovy máme k dispozici základní data, z pohledu provádění konkrétní operace na konkrétním účtu více či méně postačující. V tuto chvíli se v bankovním systému odehrává z pohledu BI proces, který nazvěme sběr primárních dat.

Podíváme-li se však na stejného klienta v kontextu všech jeho produktů, v kontextu správně transformovaných primárních dat, např. z hlediska měsíčních součtů a počtu kreditních a debetních transakcí a přidáme-li navíc kontext časový, tj. historizaci v časové řadě několika měsíců, vidíme rázem stejná data ve zcela jiné optice a situace tohoto klienta může vypadat například takto: klient vykazuje v intervalu jednoho měsíce pravidelně jedinou kreditní operaci ve výši přibližně 15 000 Kč, u které můžeme vyslovit domněnku, že se jedná o měsíční mzdu, dále vidíme za stejné období mnoho menších debetních operací, typicky výběry z bankomatu, a nakonec jednu významnou debetní operaci přibližně ve výši obvykle 4 000 Kč, a jedná se o bezhotovostní převod mimo naši banku, o které můžeme vyslovit hypotézu, že tento klient deponuje nebo jinak zhodnocuje část svých prostředků v jiném ústavu, případně splácí úvěr, a tudíž by bylo vhodné jej oslovit a nabídnout mu služby vlastní.

Okamžitě se nabízí otázka: "Kolik takových klientů v bance máme?" V tuto chvíli nastupuje Business Intelligence oddělení, které různými matematickými, stochastickými a jinými metodami provede analýzu a identifikuje kýženou skupinu zákazníků, zároveň kvantifikuje, kolik prostředků touto cestou bance uniká, přičemž z dat vznikla zcela konkrétní informace.

Prodejní síť vybavená touto informací podniká rozhodnutí a následují akce s cílem využít informaci ve vlastní prospěch, např. definováním a spuštěním cílené kampaně s nabídkou depozitních, případně úvěrových produktů. Akce a rozhodnutí musí být uděláno tak, aby bylo možné ověření výše vyslovené hypotézy, takže například současně s naší skupinou (A) bude do kampaně vybrána stejně velká, ale náhodně vybraná skupina klientů (B).

Posledním krokem je měření odezvy na kampaň a její vyhodnocení. Kde se může ukázat významně vyšší úspěšnost u skupiny (A) a tím pádem získáváme znalost, kterou uvedeme do rutinního života prodejní sítě.


Schéma BI koncepce

Závěry z uvedeného příkladu je možné shrnout, do následujících tvrzení:

1. BI je o transformaci dat v obchodní informace a o jejich následnému využití ke konkrétním akcím a rozhodnutím podporujících cíle organizace.

2. BI snoubí v hojné míře následující věcné a odborné oblasti obchodní, IT, analytická a tudíž se nejedná pouze o IT záležitost a úspěšné BI projekty by v tomto kontextu neměly být prvotně řízeny IT oddělením.

3. BI řešení se skládají v podstatě z následujících dílčích procesů:

. sběr dat (business measures gathering)
. transformace a historizace dat (datawarehousing, data quality management)
. analýza dat (analysis, datamining, database research)
. přijetí rozhodnutí a akcí (taking actions and decisions, follow up)
. vyhodnocení akcí a měření (feedback)

BI řešení a koncept lze aplikovat na různé typy úloh a věcných oblastí, uveďme například Campaign Management (realizace a vyhodnocování inteligentních a cílených kampaní), Customer Churn Management /Customer Retention Management (systém na identifikaci a udržení odcházejících zákazníků), Fraud Management (systém pro identifikaci podvodů), Risk Management (systém vyhodnocování kredibility zákazníka).

V dalších dílech a v rámci možností rozebereme některé konkrétní typy nasazení BI více. Nyní se věnujme procesům, které jsou společnými jmenovateli pro jakékoli BI řešení - a sice sběru, transformaci a historizaci dat.

Sběr dat
Sběr dat týkajících se obchodních výsledků práce s klientem je obvykle realizován primárními a základními provozními systémy jako ERP, SCM, CRM, e-Business B2C, B2B systémy a dalšími specifickými systémy pro jednotlivé obory podnikání.

Z pohledu potřeb BI však tyto systém trpí následujícími nedostatky:

Volatilita - povaha transakčních systémů a struktura dat v nich uložená odpovídá požadavkům na transakční zpracování dat, nikoli na analýzu dat, tyto systémy jsou v neustálém pohybu a v režimu aktualizace.

Roztroušenost, resp. duplikování primárních dat do a v několika nezávislých systémech a jejich odlišná struktura a formát (typickým příkladem jsou data o klientech).

Absence paměti - transakční systémy obvykle nemají paměť , tj. nejsou vybaveny pro podchycení historických dat a zachycují pouze stav aktuální.

Z pohledu BI lze však na tyto základní a primární systémy pohlížet jako na systémy určené k zachycení obchodní reality, obchodních výsledků, tj. ke sběru dat. Je třeba počítat s tím, že struktura této části je v každé společnosti, co do platforem a architektur, unikátní a svým způsobem daná.

Transformace a historizace dat
Příprava dat je společným jmenovatelem všech BI řešení a v podstatě jde o to, jaká data a jakým způsobem je třeba připravit. Úlohu přípravy dat v rámci BI je možné řešit různými metodami, typicky se však řeší datovým skladem (datawarehouse). Této problematice je a byla věnována řada slov a není ambicí této série jít do většího detailu než vyjmenování klíčových principů.

V rámci tohoto procesu se typicky řeší následující úlohy:

Dokumentace dat a procesu plnění - zásadní částí budování datového skladu je dokumentace datových struktur a zejména tzv. transformačních a obchodních pravidel, kvalita této části datového skladu může značně ovlivnit důvěru v data v něm uložená.

Konsolidace a unifikace dat - typicky dochází ke slévání dat stejného typu do jedné cílové struktury a dále pak identifikaci jednoho a téhož záznamu v různých systémech.

Historizace dat - tam, kde je to žádoucí, je držena historie dat a vývoj jednotlivých atributů, historie dat je z pohledu BI zcela zásadní a obsahuje tzv. behaviorální esenci dat, o níž bude zmínka v dalších dílech.

Čištění a kvalita dat - primární systémy v důsledku svého stáří a původu vzniku trpí často nedostatkem validačních a jiných kontrol, které mají vliv na kvalitu vkládaných dat.

Na budování datového skladu, tak aby poskytoval základní funkce, které jsou potřeba, je vhodné mít následující technologické komponenty:

. MetaData Systém - typicky nástroje CASE popřípadě podobné nástroje; obsahuje dokumentaci struktury databáze a dokumentaci procesu jejího plnění.

. Databázový Systém - typicky RDBMS; takový, aby odpovídal zejména plánovaným objemům - obsahuje vlastní data.

. ETL Systém/Software - realizuje vlastní datové pumpy a přenosy dat, včetně případného plánování a monitoringu.

Schéma vnitřní výstavby datového skladu je možné odvíjet v principu dvěma možnými směry: podle Inmonovy koncepce (data jsou uložena v tzv. 3 normální formě) nebo podle Kimballova koncepce (data jsou uložena v hvězdicové, případně vločkové struktuře). Každá koncepce má své výhody a přirozeně své zastánce a odpůrce.

Vlastní volba technologických komponent je do značné míry závislá na konkrétní situaci u zákazníka, přičemž parametry ovlivňující její volbu mohou být stávající technologické a personální zázemí společnosti, objemy dat a případně další preference zákazníka.

Pro BI zůstává zásadní podmínkou správně vybudovaný datový sklad, který odstraňuje nedostatky popsané na začátku této podkapitoly. Právě způsob a kvalita, jakým je tato část budována, do značné míry určují úspěšnost návazných řešení. Nutno říci, že budování podnikového datového skladu je úloha dlouhodobá a velmi komplexní, na druhou stranu se správné budování provádí po menších přírůstcích, dle obchodních priorit společnosti a to tak, aby každý další přírůstek zapadal koncepčně do celého řešení. Ze zkušenosti lze říci, že podle velikosti organizace a rozsahu prvních etap je možné prvních výsledků dosáhnout do 3 měsíců.

Podstatnou částí BI řešení jsou pak další komponenty a nadstavby, kterým budou věnovány další díly seriálu.

Základní pojmy:
DataWarehouse - speciální informační systém určený zejména pro kladení tzv. ad-hoc dotazů, reporting, analýzy a případně je zdrojovou bází dat pro další podpůrné systémy.

MetaData - data o datech, popisují datové struktury a procesy plnění těchto struktur. MetaData bývají často neprávem opomíjenou a podceňovanou složkou systému.

ETL nástroj - Extraction, Transformation and Loading - nástroj, který technologicky zajišťuje prakticky jediný a zásadní proces, který probíhá v datovém skladu, a sice přenos a transformaci dat ze základních systémů do datového skladu.

Pozn. red.: Autor, Tomáš Bárta, působí jako Project Manager ve společnosti NESS.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Modernizace IS je příležitost přehodnotit způsob práce

IT Systems 4/2025V aktuálním vydání IT Systems bych chtěl upozornit především na přílohu věnovanou kybernetické bezpečnosti. Jde o problematiku, které se věnujeme prakticky v každém vydání. Neustále se totiž vyvíjí a rozšiřuje. Tematická příloha Cyber Security je příležitostí podívat se podrobněji, jakým kybernetickým hrozbám dnes musíme čelit a jak se před nimi můžeme chránit. Kromě kybernetické bezpečnosti jsme se zaměřili také na digitalizaci průmyslu.