facebook
Tematické sekce
 
Branžové sekce
Přehledy
 
Tematické seriály
 

GDPR

General Data Protection Regulation zásadně mění zpracování osobních údajů a zavádí nové povinnosti...

články >>

 

Jak uřídit IT projekt a nezbláznit se

Užitečné tipy a nástroje pro řešení problémů řízení inovací a vývoje produktů...

články >>

 

Industry 4.0

Průmysl 4.0

Jaký vliv bude mít čtvrtá průmyslová revoluce na výrobu a výrobní firmy?

články >>

 

Komplexní svět eIDAS

O nařízení eIDAS již bylo mnoho řečeno i napsáno. A proto jediné, o čem...

články >>

 

Trendy v CRM

Systémy pro řízení vztahů se zákazníky (CRM) prochází v posledních letech výraznou změnou. Zatímco dříve...

články >>

 

Příručka úspěšného IT manažera

Dnes je řada IT manažerů opomíjena. Úspěšní bývají brouci Pytlíci a Ferdové...

články >>

 
Partneři webu
K2 atmitec
IT SYSTEMS 10/2013 , AI a Business Intelligence

Business analytics: kolik asi prodáme?



SAS ForecastingKolik toho příští týden, měsíc nebo kvartál prodáme? A komu? Za kolik? Poznáváte tyto otázky? Vítejte u dalšího dílu miniseriálu o business analytics, tentokrát na téma demand driven forecasting.



A co že vlastně chceme prodávat? To je v podstatě jedno. Položené otázky a odpovědi na ně jsou podobně důležité pro výrobce, obchodníky, podnikatele ve službách, vydavatele periodik i finanční instituce. Všichni potřebují plánovat kapacity výrobních linek, tiskáren nebo personálu, protože změny na poslední chvíli, pokud jsou vůbec realizovatelné, mohou stát obrovské peníze. Umění dobře předpovídat vývoj trhu a poptávku tak často mívá doslova cenu zlata. I proto je s podivem, že mnohé firmy stále ještě nejsou ochotné investovat do oblasti forecastingu větší objem zdrojů. Nebavíme se přitom zdaleka jen o penězích. V této oblasti více než kde jinde platí, že lidský kapitál a know-how jsou jen těžko nahraditelné.

Forecasting v obvyklé podobě

Jako forecasting zpravidla označujeme analytickou úlohu, která jako vstup dostane historické hodnoty nějakého sledovaného faktoru, například prodejů, a jako výstup dává odhad (predikci, forecast) budoucího vývoje. Pro výpočet predikce se využívá specifická struktura problému – data jsou ve formě časové řady a sleduje se především průběh sledované veličiny v čase, změny, sezonní výkyvy a podobně. Tím se forecasting liší od obecného prediktivního modelování, kde naopak detailní časovou informaci obvykle nemáme a modelujeme chování sledované charakteristiky v závislosti na hodnotách tzv. prediktorů (viz úvodní text miniseriálu).

To je i důvod, proč se pro úlohy forecastingu vyvinuly a používají specifické metody a pochopitelně také speciální software: obecné statistické a dataminingové metody nejsou pro zpracování a analýzu časových řad nejvhodnější. Čestnou výjimkou jsou v tomto případě neuronové sítě, které jsou natolik flexibilní, že se v praxi používají i k řešení některých typů úloh například v oblasti predikce spotřeby elektrické energie, plynu a podobně. Jinak hrají prim algoritmy specializované, ale business forecasting zdaleka není jen o algoritmech – na rozdíl od akademických diskusí jsou zde kromě přesnosti predikce velice důležité i automatizace, spolehlivost a škálovatelnost forecastingového systému.

Tolik ve stručnosti po technické stránce, později se samozřejmě podrobněji podíváme, jak by měl moderní automatizovaný systém pro business forecasting vypadat. Nesmíme ovšem zapomínat ani na implementaci a návazné interní procesy. Zatímco ve světě je zcela běžné, že forecasting obstarává ve středních a větších firmách celé oddělení analytiků a jejich výstupy odebírají uživatelé napříč celou firmou, v našich krajích tomu tak obvykle není.

Velmi častým jevem je outsourcing, firmy si forecasting (někdy ještě s optimalizační analýzou) nakupují jako analytickou službu. Tento přístup má samozřejmě spoustu výhod, jako jsou krátkodobě relativně nižší náklady nebo stálá kvalita výstupů bez nutnosti mít a proškolovat vlastní zaměstnance, ovšem má i minimálně jednu velmi podstatnou nevýhodu: závislost na konkrétním dodavateli a ztrátu onoho tolik potřebného know-how, které zůstává v externí firmě dodávající forecasting „na klíč“. Objednavateli navíc samozřejmě zůstávají náklady spojené s pořízením a skladováním dat potřebných pro predikce, za zpracovaná data pak vlastně zaplatí znovu.

Obr. 1: Důležitost možnosti výběru z více metod a modelů - jednodušší model s chybou 14,5 %.

Obr. 1: Důležitost možnosti výběru z více metod a modelů - model s jinými trendovými komponentami, chyba 1,1 %.
Obr. 1: Důležitost možnosti výběru z více metod a modelů. Nahoře jednodušší model s chybou 14,5 %, dole na stejných datech model s jinými trendovými komponentami, chyba 1,1 %.

Výše popsaný model je bezesporu vhodný pro menší společnosti, u nás jej však ještě donedávna využívali nebo stále využívají i velcí hráči například v potravinářském průmyslu nebo v maloobchodu. Druhý možný model – „in house“ forecasting, tj. analýza dat a predikce poptávky generovaná vlastními silami, je totiž minimálně zpočátku mnohem pracnější a nákladnější (tedy pokud to s forecastingem myslíme opravdu vážně). Přesto se dlouhodobě jednoznačně vyplácí.

Pracnější a nákladnější bývá tento způsob proto, že firmám často chybí vhodný software a vhodní lidé. Můžete zkusit hádat, jaký software se dnes pro forecasting používá nejčastěji. Ano, je to on, náš starý dobrý známý Microsoft Excel, kterému na paty šlapou jednoduché forecastovací enginy plánovacích (ERP) systémů. Nic proti Excelu, ale přece jen se jedná o tabulkový procesor, a ne o analytický nástroj určený pro forecasting. Podobně je ERP nástroj určený především na plánování a forecast je pro něho vlastně jen jedním ze vstupů.

S použitým softwarem jde ruku v ruce kvalita výstupních predikcí, které se po výpočtu v jednoduchých forecastovacích nástrojích musí často manuálně upravovat – přidávají se vlivy externích faktorů, jako například počasí (nápojářství), sezonní výkyvy, promo akce (maloobchod) a podobně. Pokud už ve firmě někdo nějakou dobu predikce generuje, obvykle tyto nástrahy zná a jedná se svým způsobem o rutinní záležitost, u které je největším problémem čas. Predikcí k úpravě bývá v lepším případě několik desítek, nebo i několik set a není problém touto rutinní činností strávit několik dní. Ještě větší potíž je pak pochopitelně situace, kdy se firma predikovat teprve učí a pravidla pro manuální korekce musí teprve vyvinout. Pokud se potom navíc stane, že autor těchto korekcí a často jejich jediný znalec odejde z oboru, nebo přímo ke konkurenci, znamená to obvykle poměrně citelnou ztrátu, které by se přitom dalo do značné míry předejít.

Automatizace vs. intuice

Dlouhodobá zkušenost navíc ukazuje, že do výsledných predikcí mají občas tendenci zasahovat i lidé „nepovolaní“, například nadřízení, kteří více než vygenerovaným číslům věří vlastní intuici. Před podobnými zásahy nezbývá než varovat – jejich přínos je jen velice zřídka pozitivní, a mnohem častěji podobné ad hoc korekce pouze vnesou do predikce větší chybovost. V poslední době se proto stále více prosazuje trend nazývaný collaborative, nebo také cooperative forecasting: skupina uživatelů včetně managementu má k dispozici náhled na data a generovaný forecast plus možnost provádět korekce, ovšem každá změna se v systému eviduje spolu s důvodem, proč byla provedena. Kromě samotné evidence změn takový systém všem umožňuje porozumět předkládaným predikcím (větší transparentnost vede obvykle k větší důvěře v předkládaná čísla) a motivuje zaměstnance i management k tomu, aby o dopadech svých korekcí více přemýšleli.

Pravděpodobně nikdy nebude existovat systém, který by nevyžadoval alespoň nějaké zásahy. Je to dáno samotnou podstatou problematiky forecastingu, některé časové řady se zkrátka chovají tak ošklivě, že se standardními metodami dobře predikovat nedají (různé studie udávají, že v průměru u 85 procent všech běžně analyzovaných časových řad lze generování predikcí plně automatizovat, zatímco u zbylých dat jsou nutné nějaké manuální korekce).

 

Obr. 2: Náhled dat s predikcí a práce s hierarchiemi v aplikaci SAS Forecast Studio. Rozbalením stromové struktury vlevo je možno přepínat mezi predikcemi generovanými na různých úrovních
Obr. 2: Náhled dat s predikcí a práce s hierarchiemi v aplikaci SAS Forecast Studio. Rozbalením stromové struktury vlevo je možno přepínat mezi predikcemi generovanými na různých úrovních

Představme si situaci běžnou například ve výrobě v potravinářství (v maloobchodu by to bylo velmi podobné, jen ve větším rozsahu co se množství položek týče). Máme několik desítek nebo stovek produktů či jejich kombinací (balení, příchutí, balíčků atd.). Vyrábí se centrálně v jednom výrobním závodě, kde se skladují i potřebné suroviny, výroba je společná pro několik zemí z regionu (ve střední Evropě typicky ČR, Slovensko, Polsko a Maďarsko) a dodávky hotových výrobků putují buď do centrálních skladů odběratelů, nebo v některých případech přímo do obchodů a restaurací. Výroba se plánuje v horizontu týdnů až několika málo měsíců, suroviny a obaly je třeba nakupovat také v předstihu několika měsíců (zde jsme omezeni skrze dodací lhůty a skladovací kapacitu).

V takové situaci musíme typicky predikovat poptávku pro každou kombinaci (produkt, balení, země, odběratel, sklad či provozovna), a to například na týdenní bázi (pro výrobu) a na měsíční bázi (pro nákup vstupních komponent). Pro pouhých deset kombinací produkt versus balení, dvě země a deset odběratelů, z nichž každý má jediné místo dodání, to dává dvě stě různých časových řad, tj. čtyři sta požadovaných predikcí (týdenní a měsíční), přitom je zřejmé, že uvedený příklad je silně zjednodušený. Bez vhodného softwaru se tak zkrátka neobejdeme. Pojďme se proto podívat, jak by měl takový software vypadat.

Jak vybrat nástroj pro forecasting?

Bezpochyby musí podporovat co nejvíce predikčních metod. Čím více, tím lépe. Na obrázku 1 vidíme příklad různých modelů nasazených na stejná data s dramaticky odlišným výsledkem. Pokud software podporuje jen omezené množství modelů, nemusí být jeho výstupy vždy použitelné. Model je navíc potřeba vybírat a testovat pro každou časovou řadu samostatně a při počtu od několika set řad tedy automaticky, bez manuálních zásahů.

Systém musí umět reportovat přesnost (nebo ekvivalentně chybovost) modelu a měl by podporovat co nejvíce metrik. Metrik existuje celá řada, přičemž každá z nich se hodí pro jiné využití. Za „zlatý standard“ lze považovat střední absolutní odchylku (mean absolute percent error, MAPE), běžná je ale podpora několika desítek podobných statistik. Při vyhodnocování kvality predikce je přitom stále častěji vidět snaha o srovnání s konkurencí nebo s jakýmsi benchmarkem typu industry standard. Zatímco druhé srovnání ještě můžeme považovat za akceptovatelné, porovnávat vlastní výsledky s firmou „odnaproti“ je vyloženě zavádějící – každá časová řada je unikátní a má jinou predikovatelnost, podobné srovnání tak často míchá jablka s hruškami. Nejkorektnější je vždy porovnávat přesnost predikce mezi jednotlivými metodami nebo modely na totožných datech, proto by dobrý forecastovací systém měl mít možnost ponechat určitou část datového vzorku pro toto nezávislé vyhodnocení kvality predikce (takový vzorek bývá označován jako hold-out sample).

Velmi často podceňovanou položkou je datová integrace a možnost využívat v modelech externí data jako prediktory – dobrý systém bude umět načítat data z co nejvíce formátů, ERP systémů a relačních databází a přímo v průběhu modelování bude statisticky testovat a vyhodnocovat vliv prediktorů, jako například předpovídaná teplota (nebo obecně počasí), a speciálních jevů, jako jsou například promo akce. Zde se jedná o specifický faktor s nutností specifického modelování, protože podobné akce obvykle znamenají skokový nárůst poptávky a potom její pozvolný návrat na původní úroveň. Podobně hierarchické rozložení jednotlivých časových řad musí podporovat několik úrovní a ideálně predikovat vývoj na každé úrovni (např. země, region, odběratel, sklad) zvlášť. Potom je samozřejmě logické očekávat, že se například predikce za jednotlivé sklady budou agregovat na vyšší úroveň (zde odběratel) – další úloha, se kterou se software musí automaticky vypořádat.

Samozřejmostí by pak pro každý systém mělo být intuitivní uživatelské rozhraní, automatizovaný reporting nebo možnost vhledu a zásahu do výběru modelu (no black box). Zásahy provedené uživatelem by si navíc měl systém zapamatovat, příště je během predikce automaticky zohlednit a tím uchovávat to nejcennější, totiž know-how specifické pro danou společnost.

Jak je vidět, požadavky na software pro business forecasting (a to jsme zde zmínili jen ty opravdu základní) nejsou úplně malé. Dnes již ale na trhu kvalitní dostupná řešení existují a bylo by chybou jim nevěnovat pozornost. Jak již bylo zmíněno výše – jedná se o investici, která se z dlouhodobého hlediska rozhodně vyplatí.

Petr Klášterecký

Autor působí ve společnosti SAS Institute jako konzultant se zaměřením na analýzy dat, prediktivní modelování a optimalizaci rozhodování. Aplikacím statistiky, data miningu a predikčních modelů se věnuje přes deset let, v SAS od roku 2007, přesto říká, že je stále co vysvětlovat, objevovat a vylepšovat.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.