IT SYSTEM 4/2003

Business Intelligence I. díl:

Data->Information->Decision ->Knowledge

Tomáš Bárta





Business Intelligence se v blízké budoucnosti nevyhnutelně stane nedílnou součástí procesů každé společnosti, neboť ústředním tématem je koncepčně rozvíjet jedno z podceňovaných aktiv, a sice know-how. Proto jsme pro Vás připravili 4dílný seriál věnovaný této problematice, jehož cílem je představit celkovou problematiku Business Intelligence (BI). Rozsah seriálu umožňuje popsat pouze základní komponenty, prvky a myšlenky BI koncepce. V rámci tohoto dílu v úvodu představíme na konkrétním příkladu hlavní myšlenky a procesy BI řešení a poté se zaměříme na první kroky, které je nutné absolvovat při budování BI a sice sběru, transformace a historizace dat.

Business Intelligence - koncept
Podíváme-li se na klienta z pohledu bankovního systému, tak jak jej vidí pracovník na přepážce, můžeme zde obvykle vyhledat klienta dle jeho identifikace, dále si zobrazit přehled jeho běžných účtů a následně přejít na detail konkrétního účtu a přečíst výši bilance jeho účtu, nastavení tohoto účtu, případně zobrazit transakce které za poslední období provedl, opět pouze na tomto účtu. Jinými slovy máme k dispozici základní data, z pohledu provádění konkrétní operace na konkrétním účtu více či méně postačující. V tuto chvíli se v bankovním systému odehrává z pohledu BI proces, který nazvěme sběr primárních dat.

Podíváme-li se však na stejného klienta v kontextu všech jeho produktů, v kontextu správně transformovaných primárních dat, např. z hlediska měsíčních součtů a počtu kreditních a debetních transakcí a přidáme-li navíc kontext časový, tj. historizaci v časové řadě několika měsíců, vidíme rázem stejná data ve zcela jiné optice a situace tohoto klienta může vypadat například takto: klient vykazuje v intervalu jednoho měsíce pravidelně jedinou kreditní operaci ve výši přibližně 15 000 Kč, u které můžeme vyslovit domněnku, že se jedná o měsíční mzdu, dále vidíme za stejné období mnoho menších debetních operací, typicky výběry z bankomatu, a nakonec jednu významnou debetní operaci přibližně ve výši obvykle 4 000 Kč, a jedná se o bezhotovostní převod mimo naši banku, o které můžeme vyslovit hypotézu, že tento klient deponuje nebo jinak zhodnocuje část svých prostředků v jiném ústavu, případně splácí úvěr, a tudíž by bylo vhodné jej oslovit a nabídnout mu služby vlastní.

Okamžitě se nabízí otázka: "Kolik takových klientů v bance máme?" V tuto chvíli nastupuje Business Intelligence oddělení, které různými matematickými, stochastickými a jinými metodami provede analýzu a identifikuje kýženou skupinu zákazníků, zároveň kvantifikuje, kolik prostředků touto cestou bance uniká, přičemž z dat vznikla zcela konkrétní informace.

Prodejní síť vybavená touto informací podniká rozhodnutí a následují akce s cílem využít informaci ve vlastní prospěch, např. definováním a spuštěním cílené kampaně s nabídkou depozitních, případně úvěrových produktů. Akce a rozhodnutí musí být uděláno tak, aby bylo možné ověření výše vyslovené hypotézy, takže například současně s naší skupinou (A) bude do kampaně vybrána stejně velká, ale náhodně vybraná skupina klientů (B).

Posledním krokem je měření odezvy na kampaň a její vyhodnocení. Kde se může ukázat významně vyšší úspěšnost u skupiny (A) a tím pádem získáváme znalost, kterou uvedeme do rutinního života prodejní sítě.


Schéma BI koncepce

Závěry z uvedeného příkladu je možné shrnout, do následujících tvrzení:

1. BI je o transformaci dat v obchodní informace a o jejich následnému využití ke konkrétním akcím a rozhodnutím podporujících cíle organizace.

2. BI snoubí v hojné míře následující věcné a odborné oblasti obchodní, IT, analytická a tudíž se nejedná pouze o IT záležitost a úspěšné BI projekty by v tomto kontextu neměly být prvotně řízeny IT oddělením.

3. BI řešení se skládají v podstatě z následujících dílčích procesů:

. sběr dat (business measures gathering)
. transformace a historizace dat (datawarehousing, data quality management)
. analýza dat (analysis, datamining, database research)
. přijetí rozhodnutí a akcí (taking actions and decisions, follow up)
. vyhodnocení akcí a měření (feedback)

BI řešení a koncept lze aplikovat na různé typy úloh a věcných oblastí, uveďme například Campaign Management (realizace a vyhodnocování inteligentních a cílených kampaní), Customer Churn Management /Customer Retention Management (systém na identifikaci a udržení odcházejících zákazníků), Fraud Management (systém pro identifikaci podvodů), Risk Management (systém vyhodnocování kredibility zákazníka).

V dalších dílech a v rámci možností rozebereme některé konkrétní typy nasazení BI více. Nyní se věnujme procesům, které jsou společnými jmenovateli pro jakékoli BI řešení - a sice sběru, transformaci a historizaci dat.

Sběr dat
Sběr dat týkajících se obchodních výsledků práce s klientem je obvykle realizován primárními a základními provozními systémy jako ERP, SCM, CRM, e-Business B2C, B2B systémy a dalšími specifickými systémy pro jednotlivé obory podnikání.

Z pohledu potřeb BI však tyto systém trpí následujícími nedostatky:

Volatilita - povaha transakčních systémů a struktura dat v nich uložená odpovídá požadavkům na transakční zpracování dat, nikoli na analýzu dat, tyto systémy jsou v neustálém pohybu a v režimu aktualizace.

Roztroušenost, resp. duplikování primárních dat do a v několika nezávislých systémech a jejich odlišná struktura a formát (typickým příkladem jsou data o klientech).

Absence paměti - transakční systémy obvykle nemají paměť , tj. nejsou vybaveny pro podchycení historických dat a zachycují pouze stav aktuální.

Z pohledu BI lze však na tyto základní a primární systémy pohlížet jako na systémy určené k zachycení obchodní reality, obchodních výsledků, tj. ke sběru dat. Je třeba počítat s tím, že struktura této části je v každé společnosti, co do platforem a architektur, unikátní a svým způsobem daná.

Transformace a historizace dat
Příprava dat je společným jmenovatelem všech BI řešení a v podstatě jde o to, jaká data a jakým způsobem je třeba připravit. Úlohu přípravy dat v rámci BI je možné řešit různými metodami, typicky se však řeší datovým skladem (datawarehouse). Této problematice je a byla věnována řada slov a není ambicí této série jít do většího detailu než vyjmenování klíčových principů.

V rámci tohoto procesu se typicky řeší následující úlohy:

Dokumentace dat a procesu plnění - zásadní částí budování datového skladu je dokumentace datových struktur a zejména tzv. transformačních a obchodních pravidel, kvalita této části datového skladu může značně ovlivnit důvěru v data v něm uložená.

Konsolidace a unifikace dat - typicky dochází ke slévání dat stejného typu do jedné cílové struktury a dále pak identifikaci jednoho a téhož záznamu v různých systémech.

Historizace dat - tam, kde je to žádoucí, je držena historie dat a vývoj jednotlivých atributů, historie dat je z pohledu BI zcela zásadní a obsahuje tzv. behaviorální esenci dat, o níž bude zmínka v dalších dílech.

Čištění a kvalita dat - primární systémy v důsledku svého stáří a původu vzniku trpí často nedostatkem validačních a jiných kontrol, které mají vliv na kvalitu vkládaných dat.

Na budování datového skladu, tak aby poskytoval základní funkce, které jsou potřeba, je vhodné mít následující technologické komponenty:

. MetaData Systém - typicky nástroje CASE popřípadě podobné nástroje; obsahuje dokumentaci struktury databáze a dokumentaci procesu jejího plnění.

. Databázový Systém - typicky RDBMS; takový, aby odpovídal zejména plánovaným objemům - obsahuje vlastní data.

. ETL Systém/Software - realizuje vlastní datové pumpy a přenosy dat, včetně případného plánování a monitoringu.

Schéma vnitřní výstavby datového skladu je možné odvíjet v principu dvěma možnými směry: podle Inmonovy koncepce (data jsou uložena v tzv. 3 normální formě) nebo podle Kimballova koncepce (data jsou uložena v hvězdicové, případně vločkové struktuře). Každá koncepce má své výhody a přirozeně své zastánce a odpůrce.

Vlastní volba technologických komponent je do značné míry závislá na konkrétní situaci u zákazníka, přičemž parametry ovlivňující její volbu mohou být stávající technologické a personální zázemí společnosti, objemy dat a případně další preference zákazníka.

Pro BI zůstává zásadní podmínkou správně vybudovaný datový sklad, který odstraňuje nedostatky popsané na začátku této podkapitoly. Právě způsob a kvalita, jakým je tato část budována, do značné míry určují úspěšnost návazných řešení. Nutno říci, že budování podnikového datového skladu je úloha dlouhodobá a velmi komplexní, na druhou stranu se správné budování provádí po menších přírůstcích, dle obchodních priorit společnosti a to tak, aby každý další přírůstek zapadal koncepčně do celého řešení. Ze zkušenosti lze říci, že podle velikosti organizace a rozsahu prvních etap je možné prvních výsledků dosáhnout do 3 měsíců.

Podstatnou částí BI řešení jsou pak další komponenty a nadstavby, kterým budou věnovány další díly seriálu.

Základní pojmy:
DataWarehouse - speciální informační systém určený zejména pro kladení tzv. ad-hoc dotazů, reporting, analýzy a případně je zdrojovou bází dat pro další podpůrné systémy.

MetaData - data o datech, popisují datové struktury a procesy plnění těchto struktur. MetaData bývají často neprávem opomíjenou a podceňovanou složkou systému.

ETL nástroj - Extraction, Transformation and Loading - nástroj, který technologicky zajišťuje prakticky jediný a zásadní proces, který probíhá v datovém skladu, a sice přenos a transformaci dat ze základních systémů do datového skladu.

Pozn. red.: Autor, Tomáš Bárta, působí jako Project Manager ve společnosti NESS.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Peníze od Ježíška? V lednu si dopřejte Apple za zlomek původní ceny

Obálka od babičky, příspěvek od rodičů, něco od strýčka. Vánoce jsou pryč, ale peníze zůstaly. Leden přináší jedinečnou šanci pořídit si prémiovou Apple techniku za ceny, které jindy neuvidíte.