facebook LinkedIN LinkedIN - follow
IT SYSTEMS 3/2014 , AI a Business Intelligence

Business intelligence 3.0



ProfinitKdyž se vedoucí antifraudového oddělení rozhodl, že vybuduje nové analytické řešení podle svých představ, zjistil, že datový sklad obsahuje pouze třicet procent potřebných dat. Dalších třicet procent dat mu přislíbili dodat během následujících osmnácti měsíců a o zbylých čtyřiceti procentech se dověděl, že stejně nikdy v datovém skladu nebudou. Pokud se vám tento příběh zdá povědomý, vítejte v klubu uživatelů klasických datových skladů.


Doby, kdy business intelligence bylo synonymem monolitického datového skladu, který jediný obsahuje „pravdu“ o celé organizaci, jsou nenávratně pryč. Takový přístup vede k tomu, že se řešení orientuje zejména na výkonnost hardwaru, který je schopen zpracovat všechna data, udržovat historii a zaručit vysokou datovou kvalitu ve všech směrech. Výsledkem je malá flexibilita, enormně dlouhá doba začlenění nových dat do skladu a zpracování v denních, nebo dokonce v měsíčních cyklech.

Jsou oblasti, kde je tento přístup opodstatněný. Například u finančních dat každý očekává, že budou přesně popsané, budou obsahovat plnou historii, budou uloženy tak, aby byly srozumitelné pro analytiky a ostatní uživatele, a že budou sedět na halíř ke konci každé měsíční uzávěrky. Monolitické, precizně strukturované prostředí se hodí tam, kde je kladen důraz na pravidelné analýzy a reporty. A je jedno, zda jsou založené na analýze historických dat a popisují trendy, nebo na prediktivních modelech a předpovídají budoucí chování.

Mnoho analytiků a dalších uživatelů začíná stále více cítit omezení, která plynou z klasického řešení. Nerozumí tomu, proč by příprava dat pro analýzu měla trvat mnohonásobně déle než samotná analýza. Nejsou ochotni akceptovat stav, kdy na akvizici nových dat do datového skladu musí čekat měsíce, a neví, proč by vlastně data měla být v centrálním datovém skladu, když je potřebují pouze sami a třeba jenom po krátkou dobu. Na druhou stranu, budování samostatných řešení pro jednotlivé útvary je vysoce nákladné. Dubluje se hardware, neefektivně se využívají lidské zdroje, a zejména se tříští znalost používaných dat a získaných informací.

Proto se v poslední době začínají objevovat nové přístupy k BI a k datovým skladům. Mluví se o business intelligence 3.0, analytics 3.0 nebo DWH 3.0. Tyto přístupy spojuje víc než jenom koncová číslice. Všechny koncepty mají společné rysy: vždy se jedná o koncept zaměřený na současné využití mnoha zdrojů, jak pro analýzy, tak pro obohacování analyzovaných dat. Dalším společným rysem je větší priorita kladená na snadnou použitelnost výsledků než na jejich excelentní přesnost. To znamená zaměření na více typů prezentačních kanálů – web, mobilní zařízení i snadné začlenění funkcionality do stávajících aplikací. Znamená to také podporu uživatelů ve vytváření vlastních dotazů, reportů a analýz nebo nabídek dalších self-servis služeb. Jinou společnou charakteristikou je zaměření se na preskriptivní analýzu – analýzu okamžité akce a optimální reakce. V okamžiku zvednutí telefonu zákaznické linky už BI musí dodávat informace o tom, proč asi zákazník volá, jaká je v tomto okamžiku nejlepší strategie komunikace, jaké služby či produkty se mají zákazníkovi nabídnout a s jakými parametry. Je jasné, že real-time zpracování po celé cestě, od sběru dat na všech kanálech až po vytváření výstupů, je absolutně nutné.

Přechod na úroveň 3.0 je komplexní změna. Vyžaduje změnit přístup k technologiím, změny v procesech vývoje BI stejně jako změny v chování samotných uživatelů. Jak se zvyšuje objem a množství typů zpracovávaných dat, zvyšuje se i množství používaných technologií pro jejich správu. Datový sklad 3.0 je konglomerát standardních relačních databází, Hadoop a dalších NoSQL databází specializovaných primárně pro nestrukturovaná data, in-memory databází a databází používajících sloupcové uložení dat pro aplikace, u kterých vyžadujeme extrémně rychlou odezvu. Množství databází se ještě komplikuje tím, že se propojují interní databáze spravující kritická data a databáze v cloudu umožňující rychle a levně alokovat a uvolňovat datová úložiště různých typů – přesně podle aktuálních potřeb. Jsou také části řešení, která se nemění a která stále vyžadují centralizovaný přístup. Důležitost těchto komponent však roste.

Největší rozdíl je patrný v požadavcích na analytiky a ostatní uživatele. Analytik klasického střihu, který si vystačil se znalostí obsahu datového skladu a se znalostí SQL, přestává být užitečný. Analytik 3.0 se musí orientovat jak v metodách statistického zpracování historických dat, tak v možnostech použití prediktivních modelů a přístupu umělé inteligence. Hlavně ale musí být schopen vyhledávat a pochopit potřebná data a proaktivně spolupracovat s uživateli napříč všemi odděleními. Největší rozdíl je ale ve schopnosti aktivního zapojení do rozvoje BI prostředí, analytik přestává být pouze uživatelem, ale stává se i tvůrcem BI prostředí. Možnost samostatného získávání a zpracování dat bez závislosti na ostatních útvarech umožňuje dodávat uživatelům potřebné informace skoro okamžitě.

Ondřej Zýka

Autor působí na pozici head of data management ve společnosti Profinit.
Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Modernizace IS je příležitost přehodnotit způsob práce

IT Systems 4/2025V aktuálním vydání IT Systems bych chtěl upozornit především na přílohu věnovanou kybernetické bezpečnosti. Jde o problematiku, které se věnujeme prakticky v každém vydání. Neustále se totiž vyvíjí a rozšiřuje. Tematická příloha Cyber Security je příležitostí podívat se podrobněji, jakým kybernetickým hrozbám dnes musíme čelit a jak se před nimi můžeme chránit. Kromě kybernetické bezpečnosti jsme se zaměřili také na digitalizaci průmyslu.