facebook LinkedIN LinkedIN - follow
IT SYSTEMS 9/2022 , AI a Business Intelligence

Data-driven přístup je o celkovém nastavení práce s daty

říká Jakub Novák ze společnosti Ness Czech



Jakub NovákRozhodování na základě dat ještě stále není ve firmách tak běžné, jak by se mohlo zdát. O tom, jak mohou organizace účelně využít svá data a jak postupovat při budování Data-driven procesů, jsme se bavili s Jakubem Novákem, který se věnuje datům a analytice ve společnosti Ness Czech.


Můžete vysvětlit, co je to Data-driven společnost?

Pojem Data-driven, jak už to bývá, vychází z angličtiny. V překladu znamená řízení na základě dat a já bych to ještě upřesnil na rozhodování se na základě dat. Společnosti překvapivě často konají svá rozhodnutí na základě zvyklostí či úsudku a relativně malou měrou používají další element – data. Přitom mají často více dat, než si uvědomují a je velká škoda, že je nevytěžují. Příkladem může být většina velkých nebo rychle rostoucích společnosti, které se na tento přístup soustředí a snaží se jej aplikovat. Jednat se může například o prodejce, primárně e-shopy, kteří na základě dat předchozích prodejů mohou efektivněji nabídnout zboží k cross-sellingu nebo up-sellingu, ale třeba také automobilky, které data využívají k optimalizaci výrobních procesů a snaží se minimalizovat neefektivitu výroby, či predikovat poruchy na výrobní lince.

Je rozhodování na základě dat dostatečné?

To určitě není. V první řadě je důležité zmínit, že data samotná jsou často téměř bezcenná. Vždy je třeba poskytnout datům kontext. Je deset prodejů hodně nebo málo? Pokud nevíme, o jaký produkt, v jaké lokalitě, případně za jaký čas se bavíme, nelze situaci korektně vyhodnotit. Informace bude jiná, pokud se půjde o měsíčním prodeji knih a jiná, pokud o prodeji luxusních nemovitostí ve stejné lokalitě a za stejný čas. V reálném světě je těch faktorů k zahrnutí mnohem více. Lze tedy říci, že čím je znalost prostředí (kontextu, byznysu a firemních procesů) větší, tím mohou být data transformována v úplnější a přesnější informace. A informace již k rozhodování lze použít mnohem lépe než pouhá data. Co se mi na projektech dlouhodobě osvědčuje, tak investovat čas do popisu vybraných byznys procesů společnosti. Tužka a papír, resp. dnes již tablet a interaktivní vizualizace má nesmírný přínos pro spojení obou světů – toho byznysového a IT (datového). U jednoho nedávného klienta jsem hned na první schůzce vypozoroval komplikovanou domluvu byznysu a IT. Pouhá vizualizace procesu skóringu zákazníků a sjednocení používaného názvosloví téměř okamžitě vedla narovnání a zefektivnění komunikace, vzájemnému pochopení se.

Jak se pozná, jestli je společnost Data-driven?

Certifikace nebo zkouška, která by umožňovala společnosti začít se označovat jako Data-driven jednoduše neexistuje. V Nessu disponujeme pokročilou metodikou prozkoumání datového řešení společnosti, ale to vlastně není pro tento případ potřeba; v podstatě se za Data-driven může prohlásit jakákoliv společnost. Ale k čemu ji to reálně bude? Data-driven přístup vnímám spíše jako mindset a celkové nastavení práce společnosti s daty. Jedná se primárně o akcelerátor využití dat. Tím, že obrovským tempem roste množství dostupných dat se skokově zvyšují možnosti společností na získání nezkreslené zpětné vazby na všechny aktivity a procesy, které lze popsat daty. Občas se může hodit i jen konzultace nových trendů a možností, porovnání se s trhem nebo rovnou audit BI/datového řešení, který pomůže akcelerovat využívání dat ve společnosti.

Můžete uvést nějaké příklady?

V podstatě každá společnost, která nabízí zboží nebo služby má své portfolio rozdělené do kategorií, segmentů, či jiných „krabiček“. Je dobré a vhodné pravidelně kontrolovat, zdali jsou všechny pro společnost přínosné. To znamená zjistit relevantní náklady a výnosy – zjistit prodeje zboží či služeb dle klientské segmentace, regionu, času a podobně. Při provedení takovéto analýzy zpravidla odhalujeme, že část portfolia je nevýdělečná a společnosti snižuje profit. Může samozřejmě dojít k rozhodnutí, že se jedná o strategický produkt a jeho další prodej bude tedy dotován. Ale co je důležité, tak pomocí dat došlo k objasnění stavu. Tento fakt je známý a může, respektive musí, být zahrnut do dalšího plánování fungování společnosti.

Často se spolu s Data-driven přístupem objevuje i pojem Big data či Cloud, můžete vysvětlit vztah mezi těmito termíny?

Data-driven vnímám jako přístup k datům primárně ze strany byznysu či vlastníka. To znamená, vím, že chci data, že je chci používat a chci z nich získávat informace, které mi zjednoduší rozhodování pří řízení společnosti a pomohou mi docílení úspor či navýšení příjmů. Ve zkratce povedou mě za vyšším ziskem. Naproti tomu Big data jsou o datech samotných a vnímám je více v té technické části. Big data řešení umožní získat více dat, z více systémů a vytěžit z nich (teoreticky) více informací, než tomu bylo v případě použití Business Intelligence nástrojů. Podobně je to s cloudem, který zjednodušuje a urychluje implementaci a správu nástrojů ke zpracování dat. Pokud chce být společnost Data-driven, může k tomu použít Big data přístupy a nástroje, může svoji infrastrukturu provozovat v cloudu, stejně jako ve svém vlastním datovém centru. Big data a cloud jsou možné způsoby, jak akcelerovat Data-driven přístup.

Jakub Novák

Můžeme to tedy brát tak, že Business Intelligence končí a začíná éra Big data?

Určitě ne. Business Intelligence je soubor konceptů a nástrojů, které jsou určené k práci se strukturovanými daty. Často jsou výstupem reporty a analýzy. To jsou požadavky v podstatě totožné pro každou společnost. Migrovat komplexně tato řešení do Big data je sice teoreticky možné, ale prakticky se neděje, není to ekonomicky výhodné. Většina těchto pokusů selhala. Je důležité říct, že Business Intelligence a Big data vnímám jako komplementární služby, které přináší společnosti informace. Každá z těchto služeb má jiné nástroje, jiné silné stránky a samozřejmě i náklady. Základem úspěchu je zvážení individuálních případů v kontextu datového fungování celé společnosti a rozhodnutí, jaký přístup zvolit.

Abychom se vrátili k Data-driven společnostem, chápu tedy, že společnost nemusí nutně investovat do Big data, pokud chce být Data-driven?

Ano, je to přesně tak. Důležité jsou první kroky a ty mohou být vykonány v podstatě s tradičním datovým řešením, tedy nejčastěji některým z BI nástrojů. Pokud společnost plánuje začít více využívat data k rozhodování, doporučuji i z ekonomického hlediska začít s technologií, která je již ve společnosti provozována.

Jaký je první krok, který byste doporučil společnostem, které se chtějí stát Data-driven?

Rozhodně zvážit dopady a nezanedbat přípravu. Během té musí dojít k identifikaci oblastí, procesů dávajících smysl začít datově sledovat a zaměřit se na prozkoumání jejich efektivity s pomocí use cases. Obecně mohou být také navrženy technologie a přístupy, kterými bude možno data získat a následně transformovat v informace.

Přechod do Data-driven by neměl být jen o tom, že si řekneme že od teď jsme Data-driven společnost. Zatím jsem zmiňoval primárně benefity a brzy v tom budu pokračovat, ale je nutné říci, že nic se nestane samo. Je nutné počítat s náklady, prozkoumáváním slepých uliček a velmi dobře vyhodnocovat co ještě má smysl řešit, a naopak v jakém bodě již řešení ukončit a zaměřit síly (a s tím spojené náklady) jinam.

Jaké jsou náklady na toto řešení?

Náklady můžeme rozdělit na zřejmé a řekněme skryté. Do zřejmých nákladů musíme započítat náklady na infrastrukturu, licence, provoz a zaměstnance. Dobrou zprávou je, že dnes již existují bezplatná řešení, která plní potřeby i velkých korporátních společností. Infrastrukturu není třeba zakupovat do vlastního datového centra, tj. kapitálové výdaje, ale lze využít cloudové řešení, což jsou provozní výdaje.

Stejně důležité je zaměřit se na skryté náklady, do kterých by měla vstoupit minimálně datová strategie. Dává smysl používat taková řešení, která jsou ozkoušená, bezpečná a architektonicky zapadají do datového ekosystému společnosti. Tato témata řeší právě Data Governance, datová architektura a Securita. Všechny uvedené oblasti by měly společně pomoci identifikovat způsob použití produkčního řešení, jeho provozování a podpory. V případě zkoušení a testování přístupů a konceptů je samozřejmě možné být benevolentnější ve volbě nástrojů. Ovšem vždy platí, že bezpečnost práce s daty je na prvním místě a žádná společnost nechce řešit problém úniku dat. Ačkoliv jsou tyto náklady skryté a leckdy podceňované, jejich zanedbání může znamenat násobně až řádově vyšší náklady později.

Jaké budou další kroky v transformaci společnosti na Data-driven?

Schválení adekvátního rozpočtu je druhým krokem po zvážení dopadů a přípravných aktivitách. Následovat by měl Proof of Concept (PoC), pomocí kterého dojde k ověření předpokladů, ve zjednodušeném prostředí, například pouze na vzorku dat a za použití neoptimalizovaného kódu. Cílem je ověřit, že use case je řešitelný pomocí dostupných nástrojů a informace poskytnuté mají očekávanou hodnotu. V případě, že nejsou předpoklady potvrzeny, dává smysl zjistit, zdali byla špatně volba nástroje či postupu, nebo nastavené očekávání. Zde platí Fail Fast přístup. U těchto PoC bohužel nelze očekávat, že všechny předpoklady budou vždy naplněny. Je třeba mít nastavené očekávání, že skvělých výsledků dosáhne pouze jeden z několika prototypů.

Využití cloudových služeb se mi osvědčilo při prototypování, kde již během jednoho týdne jsme měli první výstupy a informace s hodnotnými informacemi pro oddělení anti-fraudu (podvodů) jedné české finanční instituce.

V případě, kdy PoC dopadne dle očekávání, mělo by dojít k tzv. „legalizaci“. Tedy přepracování kódu aplikace tak, aby respektoval standardy a pravidla aplikací nasazovaných do produkčního prostředí, vytvoření dokumentace, případně zaškolení uživatelů. Obvykle tato legalizace bývá násobně delší proces než samotný ověřovaný koncept.

Poslední fází je vyhodnocení přidané hodnoty informací při produkčním použití.

Vyplatí se podle vás investice do dat?

Jednoznačně ano. Data, respektive informace z nich získané pomáhají zjednodušit konání náročných rozhodnutí. Navíc dat je kolem nás čím dál více, se současnými technologiemi můžeme vytěžovat nejen data s pevnou strukturou, ale také semi­struk­tu­ro­va­ná, což mohou být například logy ze systémů, a nestrukturovaná, jako třeba fotografie, videa a zvukové záznamy. Největší přidaná hodnota bývá v kombinaci dat z rozdílných zdrojů. Data taktéž pomáhají v rozhodnutích eliminovat autorskou slepotu či zaujetí typické po letech ve společnosti. Data poskytují jiný, nový náhled na realitu. Skrývá se v nich obrovská hodnota a ten, kdo je schopen a ochoten informace z dat vytěžit, tak má jednodušší rozhodování a umožní lépe reflektovat rychle se měnící požadavky trhu. A to nejlepší nakonec; zefektivnění procesů na základě dat a Data-driven přístupu je možné pro každou oblast jakékoliv společnosti.

Rozhovor připravil Tomáš Jirásko.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.