facebook LinkedIN LinkedIN - follow
IT SYSTEMS 7-8/2013 , AI a Business Intelligence

Business analytics: od papíru k high performance analytics



SASBusiness analytics. Dvě slova, jejichž spojení je pro mnoho lidí pouhá fráze, „buzzword“ bez skutečného obsahu. „Ani přeložit se to pořádně nedá,“ odpoví vám mnozí na otázku, co si pod tímto pojmem představit. Mají svým způsobem pravdu, většina pokusů o překlad vyznívá přinejmenším komicky. V tomto článku, prvním z miniseriálu o analýze dat, který bude na stránkách IT Systems vycházet, se ale nebudeme zabývat jazykovědou. Zaměříme se na význam business analytics a její vývoj v prostředí moderních podniků.


Anglická Wikipedie po zadání dotazu „business analytics“ vznešeným jazykem praví, že jde, volně přeloženo, o soubor znalostí, technologií, aplikací a postupů pro neustálé zkoumání a analyzování historického vývoje a výkonnosti společnosti za účelem zefektivnění jejího řízení. Následuje cosi o využívání dat, často dokonce velkých dat (viz další nepřeložitelný pojem „big data“), statistiky a data miningu. Hmm… Taky se vám to zdá trochu zbytečně složité? Zkusme to jednodušeji.

Tradiční business analytics a role IT

Do oblasti BA spadá jednoduše téměř vše, co lze nějakým způsobem měřit a vyhodnocovat. Sledujete prodeje jednotlivých produktů, balíčků, služeb? V celkovém úhrnu plus po jednotlivých obchodnících? Vyhodnocujete kvalitu produktů a spokojenost zákazníků? Necháváte si na to zpracovávat průzkumy? Rozesíláte zákazníkům reklamní materiály a sledujete, kdo zareaguje? Snažíte se vybírat z více variant a optimalizovat náklady, ziskovost, vytížení kapacit? To jsou jen některé z mnoha příkladů. Někdo možná namítne, že mnoho z uvedeného lze označit jako „business intelligence“. V zásadě bude mít pravdu, linie mezi BI a BA může být velice tenká a nejasná. Termín BI je ale vyhrazen spíše pro oblast reportingu a souvisejících věcí. Řada společností však do reportingu řadí například i vizualizaci dat, kterou jinde už považují za součást business analytics.

BA není v zásadě nic nového. Již dávno před nástupem počítačové éry si obchodníci vedli evidenci o prodaném zboží, aby pak mohli na základě těchto dat doobjednávat a dokupovat zásoby. Dalšími příklady s dlouhou historií a tradicí mohou být řízení kreditního rizika v bankovnictví nebo přímý marketing se snahou nabídnout zákazníkovi podle jeho profilu co nejvýhodnější produkt. Všechny zmíněné analýzy dodnes tvoří základní pilíře BA ve všech typech společností – řízení rizik zejména v bankách a pojišťovnách, přímý marketing téměř všude a forecasting pak hlavně ve společnostech výrobních a obchodních. Obecně pro celou oblast BA platí, že samotná analýza zůstává v principu stále stejná. Podmínky, ve kterých se provádí, se však v posledních letech výrazně změnily a vše nasvědčuje tomu, že se budou měnit i nadále.

Možnosti práce s daty, jejich zpracování a analýzy, rychle přibývají. Před padesáti lety stačila obchodníkovi k analýze prodejů tužka a papír, všechna data měl k dispozici a analýzu si udělal sám. V dnešní době byl v malých firmách papír nahrazen Excelem, ve větších potom datovými sklady a specializovanými analytickými nástroji, jako jsou SAS, SPSS, Statistica, R, Matlab a další. Tedy v ideálním případě. Bohužel běžnou praxí v mnoha velkých institucích jsou excelovské sešity posílané z oddělení do oddělení e-mailem. O bezpečnosti, kontrolovatelnosti a spolehlivosti takového postupu asi nemá cenu dlouze diskutovat. Otázkou zůstává, proč se s tím vlastně nic moc neděje a co na to říká IT oddělení. Role IT je přitom pro úspěšné nasazení BA v jakékoli firmě naprosto klíčová. IT zajišťuje infrastrukturu, instalaci, ve spolupráci s dodavatelem obvykle i správu a podporu systému. Mělo by si tedy udržovat i základní povědomí o funkcích a určení daného systému. Přesto se často setkáváme se situací přesně opačnou. Se situací, kdy je analytický software pro IT jen další kus, práce navíc. Takové uspořádání, kdy jsou na jedné straně barikády firemní uživatelé a na druhé IT oddělení jen jako poskytovatel bez dalšího zapojení a vlivu na chod systému, mnohdy není efektivní. Při prvních problémech se obvykle začnou objevovat snahy nastavený systém a standardní nástroje nějakým způsobem obejít. Nesystémová řešení pak pro firmu znamenají především zvýšení rizik a nákladů – duplikování práce, nejednotná vstupní data, neefektivitu a v konečném důsledku frustraci většiny zúčastněných. Mnohem výhodnější je proto podobným situacím předcházet a zapojit IT plně do hry. To ovšem vyžaduje na jedné straně schopnost své potřeby důkladně vysvětlit, na straně druhé pak ochotu pozorně naslouchat.

Co všechno lze BA nástroji řešit?

Rozhodně zde nemám ambici popsat všechny myslitelné BA aplikace. Pokusím se ale vypíchnout ty nejznámější a nejrozšířenější a v dalších dílech tohoto seriálu se naopak zaměříme na ty, které doposud tak rozšířené nejsou.

Zdánlivě nejjednodušší úlohou je vizualizace dat. Vizualizace dat formou grafů a případně tabulek je pro člověka přirozená forma analýzy a ne nadarmo se říká, že jeden obrázek často vydá za několik stran textu nebo čísel. Přesto měla historicky tato oblast v rámci BA spíše menší, podpůrnou roli, protože potřeby uživatelů narážely na technické možnosti. Na rozdíl od reportingu nebo OLAP kostek musí být vizualizace dynamická, téměř nic nelze předpočítávat a uživatel musí mít naprostou volnost v tom, co a jak chce analyzovat. Typická tabulka k vizualizaci obsahuje například časové řady a trendy prodejů – celkové, po regionech, po pobočkách, po obchodnících, po letech, po produktech, podle ceny, podle poskytnuté slevy atp. Každý dokáže vymyslet další a další dimenze, takže klasická OLAP kostka přestává stačit. Posledním trendem ve vizualizaci dat jsou proto tzv. in-memory nástroje, které dokáží požadovanou analýzu provádět bez předpočítávání rovnou v paměti (a tedy rychle), a to i nad daty s velikostí v řádu stovek gigabytů nebo několika terabytů. Požadovaná doba odezvy je přitom u takových systémů typicky v řádu několika sekund. Přínosy takového nástroje jsou zřejmé na první pohled, pro IT je to hlavně úleva od nekonečných požadavků na přípravu dat a reporty všeho druhu, pro byznys uživatele je to volnost a plná kontrola při práci s daty a s tím spojená zodpovědnost za finální podobu analýzy.

Ukázka vizualizace dat v nástroji SAS Visual Analytics
Ukázka vizualizace dat v nástroji SAS Visual Analytics


Již ze samotné vizualizace lze často zjistit základní trendy a souvislosti nebo rozdíly mezi jednotlivými skupinami klientů, smluv a podobně. Tato úroveň detailu je typicky dostačující pro základní manažerský přehled. Moderní BA nástroje ale mohou nabídnout mnohem víc. Již poměrně standardně se dnes řeší například segmentační úlohy. Segmentovat můžeme téměř cokoli, zaveďme tedy univerzální pojem „entita“. Cílem segmentace je totiž najít mezi všemi entitami takové, které mají něco společného, a ty potom přiřadit do stejné skupiny (segmentu). Pro jednotlivé segmenty pak společnost může definovat strategii, nabídky ap. Neříkáme přitom předem, co mají mít entity v jednotlivých segmentech společného ani kolik jich má v rámci segmentu být, to si příslušný software zjistí sám. Naším úkolem je potom pouze vyhodnotit, zda finální segmentace vyhovuje našim potřebám. Je přitom zcela zřejmé, že se tyto potřeby opět budou i v rámci jediné instituce lišit podle jednotlivých oddělení.

Historicky společnosti nejčastěji používaly jednu expertní segmentaci typu bohatí/chudí klienti, případně segmentaci zohledňující více faktorů, ale stále s expertně nastavenými segmenty. Výhodou je zde snadná implementace, obrovskou nevýhodou naprostá nepružnost. Zatímco dříve se role IT často omezovala jen na implementaci segmentace do IT systémů, dnes funguje IT daleko častěji jako poskytovatel nástrojů, které všem zainteresovaným oddělením umožní vlastní definice a kombinace segmentů. Výsledkem je opět snížení zátěže pro IT a přitom vyšší spokojenost koncových uživatelů – pomocí stejného nástroje může například marketingové oddělení segmentovat klienty podle jejich chování nebo zvyklostí a hned vedle může controlling segmentovat smlouvy podle zcela jiných kritérií.

Klasickými příklady využití segmentace jsou věrnostní kartičky v supermarketech (segmentace podle nákupního chování), využití dat o hovorech a SMS/MMS zprávách (segmentace v telekomunikacích) nebo segmentace odběratelů, poboček či obchodů podle preferovaných produktů, velikostí atd. Máte věrnostní kartu v supermarketu? Pak vězte, že o vás obchodník ví mnohem více, než si možná myslíte. V okamžiku, kdy vám bude chtít něco nabídnout, má díky analýze vašeho nákupního chování obrovskou výhodu. Může lákat na to, co kupujete nejčastěji, testovat, jaká cena je pro vás ještě zajímavá, atd.

High performance analytics

Co kdyby obchodník nebo výrobce chtěl umět předpovídat budoucnost? I to lze pomocí moderních BA nástrojů „zařídit“. Výrobní firmy dnes naprosto běžně využívají statistický forecasting jako základ pro plánování výroby, finanční a telekomunikační společnosti zase tzv. prediktivní modely pro odhad budoucího chování jednotlivých klientů. Problematice forecastingu se budeme věnovat samostatně v některém z dalších dílů miniseriálu, podívejme se proto podrobněji na prediktivní modely.

Jejich počátky se datují hluboko do minulého století a k jejich prvním aplikacím patřil aplikační skóring žadatelů o bankovní úvěry. Banky potřebovaly posoudit rizikovost klientů a odhadnout, kdo úvěr splatí. Časem se využití modelů masově rozšířilo. Dnes je tak můžeme potkat i při výpočtu skóre pro collections (jak bude klient reagovat na zvolenou strategii), marketingové aktivity (jak bude klient reagovat na oslovení konkrétní nabídkou), uplatňují se dokonce i v pojišťovnictví nebo ve státní správě a samosprávě, například při vyhledávání podvodů, podezřelých operací a podobně. Princip prediktivního modelování se od prvopočátku nezměnil – potřebujeme skupinu záznamů, kde známe modelované chování. Statistické algoritmy potom dokáží najít v datech skupiny záznamů, které mají stejné nebo podobné vzorce tohoto chování, a popsat je pomocí dalších charakteristik, tzv. prediktorů. Schopnost splácet půjčku tak dokáže prediktivní model popsat pomocí ukazatelů jako je příjem žadatele, věk, vzdělání a řada dalších faktorů, které ale známe již v době podání žádosti. Nový žadatel pak jen vyplní dotazník, který se porovná s uloženým modelem. Pokud jsou vyplněné hodnoty podobné těm, které měli bezproblémoví klienti, úvěr se schválí, a naopak.

Princip modelování je tedy stále stejný. Co se však výrazně změnilo, jsou metody, které se pro modelování používají. Zde za současné možnosti vděčíme především rychlému rozvoji výpočetní techniky, který umožnil masové nasazení výpočetně náročných algoritmů, jako jsou rozhodovací stromy a lesy, neuronové sítě a další. Jedná se vesměs o metody, které jsou teoreticky známé a algoritmizované již několik (desítek) let, ale doposud byla problémem jejich vysoká výpočetní náročnost. V dnešní době, kdy je výkonný hardware v podstatě komoditní záležitost, je trendem budování analytických center (někdy se používá i termín analytical factory) podporujících masivní paralelizaci výpočtů a nasazování výkonných nástrojů, které tuto výpočetní sílu umí využít. Z hlediska koncových uživatelů je přitom nejzásadnější, aby se o technické záležitosti postaral sám analytický software. Běžný analytik nechce řešit například load balancing nebo škálovatelnost analytického serveru, ale chce, aby systém počítal rychle a správně, a to i nad velkými daty. Velcí dodavatelé analytických řešení o této poptávce samozřejmě vědí a nabízejí systémy pojmenované obvykle high performance analytics, high performance data mining a podobně. Tyto systémy jsou u nás stále ještě poměrně nové, nicméně zkušenosti ze zahraničí ukazují, že není čeho se obávat, nasazením těchto nástrojů naopak dochází k výrazným časovým úsporám, výjimkou není ani snížení doby výpočtu z několika desítek hodin na minuty.

Závěrem

Oblast business analytics má za sebou poměrně rušné, až přelomové období. Během něho postupně docházelo k penetraci analytických nástrojů téměř do všech oddělení všech typů podniků. Nástroje pro BA se dnes využívají pro řešení širokého spektra analytických úloh od vizualizace dat až po komplexní predikční a optimalizační problémy. Zároveň se svět BA proměnil ze světa pro úzkou, specializovanou skupinu expertních uživatelů na svět výrazně otevřenější. Nástroje BA dnes využívají analytici, modeláři, BI specialisté, ale i management. To vše při postupném přechodu na technologie umožňující efektivní zpracování velkých datových objemů. Nepochybně bude velmi zajímavé sledovat, jakým směrem se vývoj bude ubírat dále, zda to budou cloudové služby, specializované výpočetní farmy, nebo něco zcela jiného.

Několika témat spadajících do BA jsme se dnes záměrně nedotkli vůbec, případně jsme je zmínili pouze okrajově. Patří sem především analýza nestrukturovaných, především textových dat, predikce poptávky (demand forecasting) a výběr nejlepší dostupné varianty (optimalizace), kterým postupně věnujeme další díly tohoto miniseriálu.

Petr Klášterecký
Autor působí jako konzultant ve společnosti SAS Institute ČR.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.