facebook LinkedIN LinkedIN - follow
Business Intelligence , AI a Business Intelligence

Velká data mohou končit velkou frustrací



Velká dataVyužití velkých objemů dat (tzv. Big Data) slibuje změnit způsob fungování firem a transformovat celé jejich podnikání – jenže v realitě se často setkáváme s úplně jinými příběhy. Problémem obvykle není samotný nedostatek dat, cenné informace se ale topí v balastu a není jasné, jak oddělit zrno od plev. Dokonce i když to podniky umí, jde mnohdy o těžkopádné a časově náročné procesy, které vyžadují vysoce kvalifikované odborníky. Vedle sebe se používá řada řešení a metod, výsledkem bývá složitost prostředí i zmatek.


Nakolik jsou Big Data trendem a způsobem, jak získat konkurenční výhodu, a nakolik slepou uličkou či přeceňovaným sloganem? Do určité míry platí obě odpovědi. K tomuto závěru došla i aktuální studie Forrester Research, která především doporučuje změnu přístupu.

Hadoop jako základ? Ano, ale...

Mnoho podniků využívá pro práci s velkými objemy dat platformu Hadoop. Tento open source framework existující v rámci projektu Apache se hodí pro ukládání a analýzu jak obrovských objemů dat, tak i dat různorodých typů včetně dat nestrukturovaných, ať už jde o videa, mapy, dokumenty nebo tweety. Jádro řešení lze získat zdarma a v porovnání s konkurencí nevyžaduje ani nákladný hardware, Hadoop lze proto rychle nasadit.

Podle analýzy a prognózy společnosti Researchbeam roste celosvětově trh kolem platformy Hadoop meziročně v průměru až o 58 % (z 1,5 miliardy dolarů v roce 2012 na očekávaných 50,2 miliard roku 2020).

Platforma Hadoop sama o sobě ale mnohdy nepřinese očekávané výsledky. Existuje několik hlavních příčin problémů:

  • Data bývají plná šumu, jsou chaotická a zejména platí, že jednotlivé soubory dat mají rozdílnou kvalitu, těžko je tedy zpracovávat dohromady bez ztráty většiny informace. Datoví specialisté tráví až 80 % svého času zápasem s daty tak, aby je uvedli do alespoň nějak použitelné podoby. Na vytěžení obchodně cenných závěrů z dat jim už málem nezbývá čas.
  • Tradiční nástroje business intelligence se různorodostí a objemem/rychlostí dat, která vycházejí z prostředí Hadoop, mohou snadno zahltit. Tyto nástroje se obvykle používají ve spořádaném, standardizovaném světě datových skladů, kde se očekává, že uživatelé od začátku vědí, jaké otázky chtějí zodpovědět a jaké dotazovací úlohy nad daty provádět. Tradiční aplikace BI se ale příliš nehodí pro „neformalizované“ zkoumání dat, kdy chceme získat maximum poznatků, aniž bychom dopředu věděli, na co se vlastně ptáme – což je při analýze velkých objemů dat častá situace.
  • Platforma Hadoop sama o sobě vyžadují školené datové specialisty. Odborníci na Big Data jsou nedostatkovým zbožím, protože se od nich očekávají znalosti SQL (tradiční databáze) a ETL (získávání dat z provozních systémů), vedle toho ale i statistiky a programování. Prognóza McKinsey Global Institute proto uvádí, že v roce 2018 bude na trhu chybět 140 až 180 tisíc datových specialistů. 37 % organizací v průzkumu Accenture již nyní připouští, že nemají kapacitu (především ve smyslu khow-how/lidských zdrojů) na průběžnou analýzu velkých objemů dat. Problémem může být také spolupráce tradičních analytiků a specialistů na big data.

Jak se vyhnout deziluzi

I společnosti, které věří, že Big Data mohou transformovat jejich byznys, tak často nevědí, jak svých cílů dosáhnout. Za těchto okolností je obtížné ospravedlnit větší investice do souvisejících technologií. Návratnost je nejistá a v tomto světle pak i Big Data jako taková mohou začít být pokládána za přeceňovaný trend. O technologii se dnes opravdu častěji píše a mluví, než aby ji podniky úspěšně využívaly.

Některé organizace se snaží platformu Hadoop doplňovat o jednoúčelová řešení. Tyto nástroje ale nebývají dostatečně komplexní, opět postrádají end-to-end funkcionalitu, která by dokázala surová data převést do podoby vhodné pro analýzu. Analytici neustále přecházejí mezi různými prostředími, je narušen tok informací i pracovních činností (workflow) a omezena schopnost rychlé reakce (agilita). Je proto potřeba volit řešení, které nabízí odlišný přístup a je vhodné i pro uživatele bez hlubších technických znalostí.

Pět doporučených kroků pro využití konceptu Big Data
  1. Najít relevantní data
  2. Prozkoumat je a zjistit jejich potenciál
  3. Transformovat je a doplnit do podoby vhodné pro analýzu
  4. Analýzou získat vlastní nové poznatky
  5. Sdílet závěry tak, aby přinesly prospěch na všech úrovních podnikání

Marta Lipovská

Článek čerpá z materiálů společností Accenture, Oracle, Researchbeam, Forrester Research a McKinsey Global Institute.

 

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

Inzerce

Umělá inteligence už není pro české firmy tabu

IT Systems 5/2025V aktuálním vydání IT Systems je opět hlavním tématem umělá inteligence, která v českých firmách stále více nachází uplatnění. Potvrzují to i závěry reportu Digitalizace podniků, který vydala společnost Asseco Solutions. Jiří Hub, CEO Asseco Solutions, jej shrnul slovy, že české podniky se opřely do digitalizace a umělá inteligence už pro ně není tabu. Stále ovšem mají co objevovat, protože ze studie společnosti McKinsey vyplývá, že potenciál AI zatím využívá jen zlomek firem a její implementaci v Česku táhnou především sektory bankovnictví, pojišťovnictví a e-commerce.