facebook LinkedIN LinkedIN - follow
IT SYSTEMS 11/2010 , AI a Business Intelligence

Open-source business intelligence



Trh softwarových řešení v oblasti business intelligence prošel v posledních letech zásadními proměnami a konsolidací. Menší úspěšní výrobci podlehli akvizičním snahám velkých hráčů na trhu, jako Oracle, SAP, IBM a dalším. Nicméně delší dobu již začíná klepat na dveře BI trhu také open-source software. Na rozdíl od jiných open-source produktů, jako jsou například Unixové operační systémy či kancelářský balík OpenOffice, se však open-source BI software dostal do povědomí IT manažerů až poměrně nedávno.


Historie business intelligence.

Magický pojem business intelligence vymezil v roce 1989 Howard J. Dresner, zaměstnanec konzultační společnost Gartner Group, který jej definoval jako sadu konceptů a metod pro zlepšování business rozhodnutí firem. Za tímto pojmem se tehdy skrývaly různé aplikace pro analýzu dat, relativně statické dashboardy pro zobrazení souhrnných informací a další aplikace sloužící potřebám především nejvyššího managementu.
Možnost upravit si tyto aplikace pro podporu rozhodování specificky pro potřeby svého podniku se tehdy pohybovala spíše v mezích teoretických, a tak byly veškeré optimalizace odkázány na mnohdy zdlouhavé vyjednávání se softwarovým poskytovatelem, který si zdrojový kód velmi pečlivě chránil.

 

Proprietární vs. open-source BI

Donedávna panoval názor, že BI je vhodné jen pro obrovské podniky se stovkami zaměstnanců, které naplno využijí jeho potenciál, avšak nedávné průzkumy dokazují, že se BI začíná postupně prosazovat také u středních, a dokonce i malých firem. Potřeba reagovat na výzvy trhu pružněji a rozhodovat se na základě přesných informací se tedy neomezuje pouze na velké podniky. BI v této oblasti plní klíčovou roli, nepočítáme-li intuitivní přístup k rozhodování, kterým často argumentují řídící pracovníci malých firem a mikrofirem.
Co se týče nabídky BI softwaru, mají zákazníci již dlouhou dobu k dispozici poměrně rozsáhlou nabídku zásadních hráčů na trhu, a sice Microsoftu, SAPu, Oracle, IBM, Microstrategy a dalších, jejichž nabízené BI produkty se často označují jako „proprietární“. Tito poskytovatelé nabízejí velmi robustní BI řešení pochopitelně za patřičných finančních podmínek.
K této nabídce se však již několik let (převážně ale v západních zemích) počítá i BI software z řad open-source. Odhlédneme-li od malých, izolovaných open-source BI projektů, které se zaměřují na konkrétní funkcionalitu (např. reporting), působí na open-source BI trhu dva základní hráči, a sice Pentaho (obr. 1) a JasperSoft. A nejde v žádném případě o sdružení dobrovolných a nadaných programátorů, ale o regulérní softwarovou společnost, která zaštiťuje a řídí vývoj svých BI nástrojů, ačkoliv za vývojem řady funkcionalit stojí členové početné uživatelské a programátorské komunity.

Obr. 1: Ukázka dashboardu od společnosti Pentaho
Obr. 1: Ukázka dashboardu od společnosti Pentaho


Mimo těchto poskytovatelů dále patří mezi významnější hráče společnosti:

  • Talend, která poskytuje řešení výhradně z oblasti master data managementu a ETL,
  • Actuate, která se, kromě vývoje vlastního analytického nástroje Actuate Analytics, ujala řízení vývoje populárního komunitního projektu BIRT (Business Intelligence Reporting Tools),
  • SQL Power Software, poskytující nástroje jak pro ETL, tak pro reporting a OLAP,
  • Jedox, poskytující mimo jiné také výkonný OLAP plugin pro Microsoft Excel,
  • MySQL AB, poskytující databázový nástroj MySQL, který je dobře známý jako databáze v pozadí mnoha webových stránek, v současné době však použitelný i jako výkonný datový sklad.

Většina produktů zmíněných pěti poskytovatelů se sice často hodí jen jako doplňující součást architektury BI informačního systému, ale v případě Pentaho (platforma Pentaho BI Suite – obr. 2) a JasperSoft (platforma JasperSoft BI Suite) jde o plnohodnotnou BI platformu schopnou pokrýt poměrně náročné požadavky na BI.

Obr. 2: Platforma Pentaho BI Suite
Obr. 2: Platforma Pentaho BI Suite

 

Mýty a bariéry zavádění open-source BI

Proti open-source software, tedy i open-source BI, se mnohdy argumentuje četnými mýty a polopravdami, které většinou vznikaly v dobách, kdy si open-source teprve získával své místo v podnikové architektuře IS/ICT a pojily se s ním bohužel nejrůznější „dětské nemoci.“ Mezi nejčastější argumenty proti open-source se často uvádí následující:

  • nízká kvalita a funkčnost,
  • nízká výkonnost,
  • nízké zabezpečení,
  • otevřenost zdrojového kódu,
  • nízká či nekvalitní uživatelská podpora ze strany poskytovatele,
  • nízká kvalita a rozsah uživatelské a referenční dokumentace,
  • nedostatečná aktivita a rozsah komunity.

Tyto argumenty už však dnes lze ve většině případů na základě zažité praxe vyvrátit. Nízká kvalita a funkčnost je spíše subjektivním protiargumentem, neboť každý uživatel očekává od nástroje něco jiného a tento mýtus spíše vychází ze zažitých předsudků ze začátků open-source, kdy software skutečně míval omezenou funkčnost a často i kvalitu.
Nízká výkonnost je poměrně komplikovanou záležitostí, neboť často záleží na mnohem více faktorech než jen na kvalitách samotného open-source softwaru (síťová infrastruktura, výkon serveru, stupeň vyladění databáze atd.), nelze tedy říci s jistotou, že tento protiargument je dostatečně životaschopný, nicméně jistá fakta ve prospěch tohoto argumentu lze najít.
Mýtus ohledně nízkého zabezpečení v podstatě vychází ze strachu z otevřenosti zdrojového kódu, nicméně pokud se jedná o open-source software (tedy i open-source BI software), existuje zpravidla poměrně rozsáhlá a aktivní komunita uživatelů, která dokáže reagovat na vzniklý problém několikanásobně rychleji než potenciální narušitel.
Argument nízké kvality a rozsahu uživatelské podpory ze strany poskytovatele ztrácí na významu v okamžiku, kdy za řízením vývoje open-source softwaru stojí velká softwarová společnost, v jejímž zájmu je dohlížet na kvalitu uživatelské podpory s cílem udržet image společnosti. Tento argument má význam, pokud zvažujeme open-source BI software, který má charakter relativně izolovaného projektu a za kterým stojí jen malá komunita uživatelů. Zde je třeba pečlivě rozhodnout zda a kam takový produkt nasadit.
Uživatelská a referenční dokumentace je spoluvytvářena členy komunity, a pokud je komunita dostatečně rozsáhlá, existuje jistá pravděpodobnost, že bude poměrně kvalitní a rozsáhlá. Nicméně tento argument má jistou váhu, neboť i velké open-source BI produkty se potýkají s obecným problémem nedostatečného zdokumentování určitých funkcí, který se však nevyhýbá ani proprietárnímu softwaru.
Nedostatečná aktivita a rozsah komunity kolem konkrétního open-source softwaru může být problém zpravidla v případě, kdy zvažujeme implementaci menšího open-source projektu, který zatím nemá v pozadí dostatečnou komunitu, a v takovém případě pak existuje poměrně velké riziko neúspěchu implementace.

Open-source BI jako vitální alternativa

Nejčastějším argumentem pro open-source BI jsou na druhou stranu jednak proklamovaná rychlá návratnost investic, a především nízké pořizovací náklady řešení, které se skutečně mohou pohybovat (v porovnání s proprietárními alternativami) až na hranici desetiny celkových nákladů. Nicméně zde je třeba dávat pozor na určité faktory, které nemusí být při prvotním očarování nízkými náklady na BI patrné.
Jsou jimi především náklady na dodatečné zaškolení programátorů, respektive administrátorů, v případě, že produkt nemá na sto procent zdokumentované funkce, a také rozsah a kvalita znalostní základny vlastních vývojových a integračních týmů, s čímž souvisí náklady na integraci, které mohou výrazně ovlivnit výsledek zavedení open-source BI směrem k červeným číslům oproti prvotnímu očekávání, pokud nejsou dostatečně v předstihu identifikována a zahrnuta do plánování.
Je tedy vhodné orientovat se na poskytovatele, za kterými stojí jednak široká komunitní základna a také stabilní softwarová společnost nabízející kvalitní doplňkové a postimplementační služby v rámci tzv. subscription fee, tedy jakéhosi předplatného (hovoří se pak o tzv. komerčním open-source BI).

Open-source BI ve světě a v ČR

Na základě analýzy studií společností Gartner (2008) a Third Nature (2009) jsme zjistili, že open-source BI patří ke vcelku využívaným nástrojům ve světě, a proto jsme se rozhodli zjistit, jaká je situace v České republice. Vybrali jsme přes dva tisíce organizací různé velikosti z jedenácti odvětví (výrobní a prodejní organizace, telekomunikace, doprava a služby, vzdělávací instituce, úřady a vládní instituce, zdravotnictví, finanční společnosti, sektor IT, stavebnictví a projektové služby). Tyto společnosti jsme pak od srpna 2010 elektronicky kontaktovali s žádosti o vyplnění webového dotazníku na internetové adrese http://formular-ekf.vsb.cz/157. Níže je uveden výběr z dosavadních našich zjištění.
V současnosti máme odpovědi od 82 respondentů, z toho pouze jeden respondent využívá open-source software (společnosti Talend), 32 respondentů nevyužívá žádný nástroj BI a 49 respondentů využívá některý z nástrojů proprietárních (tradičních) poskytovatelů. Výzkum ukázal, že se respondenti nejvíce spoléhají na nástroje společnosti Microsoft (44 %), dále pak využívají nástroje od společnosti SAP (20 %), Oracle (16 %), IBM (9 %), SAS (3 %), SPSS (3 %), Board International (2 %), QlikTech (2 %), Sybase (2 %) – viz obrázek 3.

Obr. 3: Procentuální využívání nástrojů BI dle jednotlivých poskytovatelů
Obr. 3: Procentuální využívání nástrojů BI dle jednotlivých poskytovatelů


Přibližně čtyřicet procent respondentů, kteří využívají nástroje tradičních poskytovatelů, přitom ani nevědělo, že existují open-source alternativy k používaným BI nástrojům. Z odpovědí respondentů je patrné, že dotazovaní dávají přednost proprietárnímu softwaru. Dále tedy byla pozornost soustředěna na faktory, které by mohly výrazně negativně ovlivnit rozhodnutí dotazovaných o pořízení open-source business intelligence nástrojů. Při vyhodnocování dotazníku vyplynulo, že respondenti, kteří využívají proprietární software, se nejvíce obávají nízké kvality a funkčnosti nástroje, nízké nebo nekvalitní uživatelské podpory ze strany poskytovatele, nízkého zabezpečení produktu, potíží s integrací do stávajícího technologického prostředí, nekvalitní nebo nekompletní dokumentace, nízké výkonnosti nástroje nebo skutečnosti, že nástroj dosud nemá žádné nebo nízké reference na trhu.
Jedna z dalších otázek pro respondenty využívající nástroje tradičních poskytovatelů se týkala využití v dohledné době některého z open-source nástrojů pro business intelligence. Celkem 31 dotazovaných o této variantě prozatím neuvažuje, ale open-source software nezavrhuje, dvanáct respondentů o využití open-source řešení neuvažuje, jelikož mu nedůvěřuje, tři dotazovaní plánují jeho implementaci v horizontu jednoho roku, jeden respondent je již ve fázi přípravy implementace a jeden uživatel tento nástroj již používal, ale kvůli technickým, organizačním nebo jiným potížím, které bránily jeho efektivnímu užívání, od využívání tohoto nástroje upustil.
Je však nutno zdůraznit, že dotazníkové šetření stále probíhá, oslovujeme další firmy s žádosti o vyplnění dotazníku, a proto není možné považovat výše zmíněné výsledky za konečné a vyvozovat definitivní závěry. V případě zájmu o další průběh výzkumu je možné kontaktovat jeho řešitele. Kontakty lze nalézt na webových stránkách http://formular-ekf.vsb.cz/157.

Budoucnost open-source BI

Mnoho firem ve světě již rozpoznalo a dokázalo využít potenciál open-source BI a implementační trendy ukazují na stále rostoucí podíl open-source BI. Důvodem může být mimo jiné fakt, že kvalita těchto nástrojů se neustále zvyšuje a roste také informovanost firem ohledně BI obecně, a tedy o možnostech jeho implementace. V ČR náš průzkum prozatím ukázal přinejmenším konzervativní přístup k využití open-source v rámci architektury BI, nicméně množství respondentů, kteří o této alternativě ví a open-source variantu BI nezavrhují, je poměrně vysoké. Lze tedy předpokládat, že ČR má v oblasti využití open-source BI výrazný potenciál připojit se ke zmíněnému světovému trendu.

Zdroje

THIRD NATURE. Open Source Solutions: Managing, Analyzing and Delivering Business Information. [online]. Poslední revize 7. 12. 2009. URL (http://www.pentaho.com/products/demos/ben_open_source_bi_report.php)
GARTNER. Who‘s who in open-source Business Intelligence. [online]. Poslední revize 28. 7. 2008. URL (http://www.bismart.be/docs/gartners_whos_who_in_open_source_bi_report.pdf)

Radek Němec, Eva Menčlová
Článek vznikl za finanční podpory Studentské grantové soutěže v rámci projektu SP/2010132, Open-source řešení Business Intelligence a Data Warehousingu ve firmách České republiky.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.