facebook LinkedIN LinkedIN - follow
IT SYSTEMS 5/2012 , AI a Business Intelligence

Postmoderní architektura BI

aneb Jak chytře čelit informační potopě



SASJednou z mnoha oblastí IT, která se bude muset vypořádat s obrovsky rychlým nárůstem velikosti dat, je business intelligence. Jak zařídit, aby bylo i nadále možné hledat a nalézat užitečnou „jednu verzi pravdy“? Jak se postavit ke zpracování, ukládání a analýze datových mas? Jak zajistit, abychom nepřišli o důležité informace a abychom přitom nevykrváceli budováním olbřímích a těžce řiditelných datových skladů? To je předmětem následujícího článku, ve kterém probereme okolnosti a projevy nové situace a její dopady na architekturu řešení business intelligence.


Jedním ze základních cílů formulovaných a popularizovaných od samotného začátku aktivit kolem datových skladů a business intelligence bylo dosažení tzv. jedné verze pravdy. Ponechme teď stranou případnou nejasnost v tom, co tento pojem vlastně znamená a kdo je arbitrem pravdivosti. Vyhněme se i diskusi, zdali má smysl se po ní pídit (vzhledem k různosti účelů, pro něž má být použita), anebo zda vůbec existuje. Postačí nám, budeme-li se držet předpokladu, že poskládání informací z různých zdrojů a jejich vyhodnocení „z celkového pohledu“ pomocí chytrých metod a nástrojů je užitečné. Pro nalezení skrytých závislostí a omezení, odhalení nových příležitostí. Zkrátka pro porozumění tomu, jak fungují naše procesy, náš byznys, naše organizace a my sami, abychom se podle toho mohli zařídit a následně vydělat či ušetřit. Inu, business intelligence.
Podívejme se však na způsob, jak se tato sjednocená, konsolidovaná a následně zušlechtěná informace získává. Z obecného pohledu je business intelligence jedním ze způsobů integrace informací. Od jiných integračních metod se liší především účelem, pro který se provádí. U všech ostatních jde zejména o zajištění provozu, takříkajíc základních životních funkcí organismu, zatímco cílem BI je ona zmíněná jedna verze pravdy, získání vhledu, což nám umožní vylepšit vlastní fungování, jak již bylo mnohokrát a mnohde řečeno. Pořád je to ale způsob integrace informací jako prostředek k dosažení onoho „vyššího“ cíle.
A jak se tato integrace provádí v praxi? Jedním z prvních dobrých nápadů bylo vytáhnout všechna data ze všech podnikových systémů, zkonsolidovaná je umístit do úložiště, a mít je pak na věky věků k dispozici pro reportování, analýzy, modelování, dolování. Když se nám tohle jednou povede, je jen otázka času, kdy se všemi daty provrtáme, abychom nalezli „informační zlatou žílu“ a skončili v „informační nirváně“. A vznikl i tomu odpovídající pojem – datový sklad.

Data za hranicemi informačních systémů

Datawarehousing se stal důležitým odvětvím IT a spousta lidí a firem se začala živit pumpováním dat a jejich uskladňováním, analyzováním, prezentováním. Je v tom však skryto ono příslovečné čertovo kopyto. Takhle to může dobře fungovat pouze za předpokladu, že prostředí, v němž data vznikají, představuje poměrně přehlednou krajinu relativně uzavřeného světa podnikových informačních systémů, jak jsme jej znali v 80. a ještě na počátku 90. let. Z dnešního pohledu šlo o vcelku idylickou dobu, kdy data v organizaci pocházela z několika jasně definovaných zdrojů. Objem dat byl o mnoho řádů menší než dnes a měla předem určenou podobu a obsah. Navíc rostla (v porovnání s dneškem) jenom mírně a předvídatelně. I na tehdejší dobu drahá řešení datových skladů byla chápána jako víceméně jednorázové investice, jež však získání požadované jedné verze pravdy vyřeší jednou pro vždy.
Samozřejmě, kdo tehdy mohl tušit, že rozvoj technologií mnohonásobně předčí všechna očekávání a počítačové zpracování už za pár let dosáhne rozměrů, jaké si šlo jen těžko představit? Že budou data vznikat stále a všude obrovskou rychlostí a bude je produkovat téměř každý jedinec, domácnost, kancelář, dopravní prostředek, že se vše komunikačně propojí a informace se začnou přelévat ve stále větších vlnách téměř bez hranic?
Inu, tehdejší koncept lze těžko zpětně zatracovat. Byl určitě funkční a užitečný, podobně jako byly ve své době jistě užitečné i megalitické stavby. Je však důležité na něm nelpět. A vypořádat se s faktem, že už se nám nikdy nepodaří vytvořit skutečnou business intelligence hrubou silou. Jinak řečeno, ať chceme nebo nechceme, musíme se smířit s tím, že jednu verzi pravdy a vhled nezískáme tím, že budeme všechna data stále fyzicky hrnout na jednu hromadu. Zkrátka – nastal čas, kdy bude třeba aplikovat inteligenci i na budování business intelligence.

Co to konkrétně znamená?

Jak už bylo mnohokrát napsáno a řečeno, v datech je ukryto bohatství a business intelligence představuje metodu, jak je vytěžit, přeměnit na peníze a jiné statky. Plošná těžba tradičním způsobem bude ovšem stále méně možná a z hlediska vynaložených prostředků a úsilí bude ztrácet efektivitu. Již dnes vidíme, že tradičně budované monolitické datové sklady představují často těžkopádné kolosy, připomínající spíše nedobytné informační pevnosti než cokoliv jiného. A přitom je třeba neustále reagovat. Na nové typy informací, které včera ještě neexistovaly, na nové datové struktury, jež dříve nebylo třeba zpracovávat (nebo to úroveň technologie v požadovaném rozsahu a kvalitě neumožňovala), jako jsou semistrukturované a nestrukturované dokumenty, na rychlost, s jakou jsou automaticky generována nová data (z telefonů, internetu, dopravy, …), na nové technologie pro ukládání dat v kolaborativních systémech atd.
To všechno už skutečně nebude možné nahrát do jedné relační databáze. Nebudeme to mít kam dát. A kdyby ano, nebudeme to stíhat ani logicky – vyznat se v tom všem –, ani fyzicky – přenášet a zapisovat data. A kdyby ano, nebudeme na to mít peníze. A kdyby přece jen ano, nemůže se nám to vyplatit!
Tak co tedy s tím? V blízké i vzdálenější budoucnosti se jistě objeví řada diskusí, dobrých nápadů i slepých uliček, vynálezů, jež mohou otevřít dnes neznámé možnosti. Akcelerující datový a informační boom je však realitou již dnes, a tak je už dnes třeba se podle toho zařídit. Přinejmenším na to myslet ve chvíli, kdy uvažujeme o rozšiřování, modifikaci a rozvoji našich stávajících byznysově inteligentních řešení. Třeba tak, že vezmeme do úvahy některý z dále uvedených příkladů z praxe. Je pro ně společné, že nevyžadují vyvrácení stávajících řešení z kořenů, a přitom znamenají koncepční posun k účinné, adaptabilní architektuře business intelligence.

1. Business intelligence pro business

Tradiční hierarchie určující postup budování řešení business intelligence vychází z prvotního shromažďování dat, jejich integrace a ukládaní do datového skladu. Z něj se pak uživatelům předkládají užitečné informace, případně pak s třešničkou na dortu v podobě pokročilých analýz, predikcí atd. – zbudou-li peníze, čas a chuť. Tento model je produktem (jistě záslužné) novátorské role specialistů IT, kteří tradičně razili cestu technologickému pokroku. Koncoví (ne-IT) uživatelé pak mají možnost si vybrat z možností, jež jim takto připravený systém poskytuje. Tento přístup určuje architekturu BI, označovanou jako data-driven (někdy také IT-driven). To však přestane fungovat ve chvíli, kdy nebude možno všechna data shromáždit ve skladu, jak je naznačeno výše.
Dnešní úroveň počítačové gramotnosti i mezi „ne-IT“ lidmi umožňuje orientovat se na odlišný přístup: vyjít z cílů a záměrů organizace, které se konkretizují ve skutečných požadavcích na informace. K nim pak hledat metody, jak je získat (tedy analytické metody), pro ně identifikovat potřebná vstupní data a nakonec stanovit způsob, jak je najít, a případně uložit tak, aby zvolené analytické metody byly co nejúčinnější. Tento přístup charakterizuje demand-driven (nebo též analytics-driven) architektura BI. Cílem je, aby při budování BI řešení byly prostředky vynaloženy co nejúčelněji vzhledem ke konečnému efektu.

2. Inteligentní integrace

Integrace informací tím, že se všechna data umístí do jedné (relační) databáze je nesmyslně drahá, málo účelná a perspektivně nemožná. Pro různé typy dat a různé způsoby práce s nimi již dnes existuje a stále vzniká řada technologií jejich ukládání. V budoucnu bude účelné a efektivní, aby byl každý odlišný typ dat spravován odpovídající technologií. Datový sklad budoucnosti tak bude tvořen řadou odlišně zaměřených a různě nákladných datových úložišť, rozhraní a služeb a vlastní integrace bude úkolem inteligentní vrstvy, jež bude ve shodě fungujících procesů (agreed processes) řídit datovou základnu včetně procesů ETL jako logický celek. Tento přístup, charakteristický pro sběrnicovou architekturu (bus architecture) datového skladu, je cestou, jak zajistit dynamiku, flexibilitu a účinnost řešení BI do budoucna i při stále se měnících a rychle rostoucích datech a požadavcích.

3. Analýza na vstupu

Je zřejmé, že všechna data, která vznikají v informačních systémech podniků i mimo ně, jsou pro další analýzu užitečná v různé míře. Vzhledem k do budoucna omezeným kapacitám pro ukládání dat je třeba rozhodnout, která z nich má smysl dále uchovávat v drahých databázích, která pouze archivovat, a která zahodit. V některých případech jsou například zajímavé pouze agregované nebo z nich odvozené informace, ačkoliv data sama o sobě mají minimální hodnotu. Rozlišení, co je a není relevantní, však nemusí být triviální. A zde se nabízí další možnost využití analytických postupů: provést rozbor dat ještě před vstupem do datového skladu a aplikovat na ně chytré metody, jež mohou například zkoumat míru jejich relevance, sledovat trendy a odchylky od nich. A potom inteligentně vybrat ty informace, jež má smysl dále uchovávat, historizovat, použít pro další analýzy atd. Vlastně to znamená, že se analytické nástroje stávají součástí integrační infrastruktury, posunují se ze špičky tradiční architektonické pyramidy business intelligence do jejích základů.

Vladimír Kyjonka
Autor působí jako business consultant pro oblast business intelligence ve společnosti SAS Institute ČR.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Modernizace IS je příležitost přehodnotit způsob práce

IT Systems 4/2025V aktuálním vydání IT Systems bych chtěl upozornit především na přílohu věnovanou kybernetické bezpečnosti. Jde o problematiku, které se věnujeme prakticky v každém vydání. Neustále se totiž vyvíjí a rozšiřuje. Tematická příloha Cyber Security je příležitostí podívat se podrobněji, jakým kybernetickým hrozbám dnes musíme čelit a jak se před nimi můžeme chránit. Kromě kybernetické bezpečnosti jsme se zaměřili také na digitalizaci průmyslu.