- Přehledy IS
- APS (25)
- BPM - procesní řízení (23)
- Cloud computing (IaaS) (10)
- Cloud computing (SaaS) (31)
- CRM (52)
- DMS/ECM - správa dokumentů (19)
- EAM (17)
- Ekonomické systémy (68)
- ERP (75)
- HRM (28)
- ITSM (6)
- MES (33)
- Řízení výroby (36)
- WMS (28)
- Dodavatelé IT služeb a řešení
- Datová centra (25)
- Dodavatelé CAD/CAM/PLM/BIM... (41)
- Dodavatelé CRM (38)
- Dodavatelé DW-BI (50)
- Dodavatelé ERP (66)
- Informační bezpečnost (48)
- IT řešení pro logistiku (48)
- IT řešení pro stavebnictví (26)
- Řešení pro veřejný a státní sektor (27)


















![]() | Přihlaste se k odběru zpravodaje SystemNEWS na LinkedIn, který každý týden přináší výběr článků z oblasti podnikové informatiky | |
![]() | ||
Jak připravit datové prostředí pro segmentaci
Segmentace. Zní to jako zaklínadlo, kterým se ohání nejenom marketingoví specialisté, produktoví manažeři, ale i vedení nejedné společnosti. Segmentaci obecně využívají zejména velké organizace, jako jsou banky, pojišťovny a telekomunikační firmy, k tomu, aby odlišily jednotlivé skupiny zákazníků. Uvnitř skupiny, respektive segmentu, se soustřeďují klienti s podobným chováním, produkty apod., a naopak skupiny zákazníků se mezi sebou liší.


K čemu je segmentace užitečná
- Rozdělení zákazníků do segmentů umožňuje:
- nabízet klientům různé produkty a služby podle jejich potřeby a chování,
- oslovovat klienty jiným obsahem kampaně a jiným komunikačním kanálem,
- prioritizovat klienty na call centru,
- mít nastavenou jinou retenční strategii v případě, že klient chce odejít,
- zjistit, které skupiny klientů jsou aktivní, generují profit a má smysl se jim aktivně věnovat, a které skupiny klientů jsou naopak na veškeré nabídky pasivní a generují pouze ztrátu,
- vytvořit speciální služby a produkty šité na míru konkrétním segmentům a nezajímavé pro zbylé segmenty.
Vytvoření kvalitní segmentace je jednou z nejtěžších dataminingových úloh. Segmenty totiž musí být snadno interpretovatelné, použitelné pro daný účel a rozumně velké. Je tak vyloučeno nechat si segmenty automaticky vygenerovat ve statistickém softwaru.
Jediným správným postupem je vhodně kombinovat statistický a expertní přístup. Obvykle to vypadá tak, že analytik na základě svých zkušeností či potřeb uživatelů formuluje první hypotézy o chování klientů, ty pak prostřednictvím statistických metod testuje na datech. Výsledky datových analýz pak vedou k prvnímu návrhu segmentace.
Takto vytvořené segmenty je potřeba popsat a konzultovat s uživateli. Výsledkem je formulace nových hypotéz, nové segmentace, nového popisu segmentů apod. Tento iterativní postup je potřeba několikrát zopakovat, než se dopracujeme ke smysluplným a uchopitelným výsledkům.
V tomto článku se primárně chceme zaměřit na data, respektive jak bychom si měli připravit data pro pravidelné segmentování.
Jak na data?
Pojďme se podívat na to, s jakými otázkami ohledně dat se můžeme setkat při přípravě datového prostředí pro segmentaci klientů ve velké organizaci.
Vytvoření datamartu
Základem je vytvoření datamartu (tabulky v datovém skladu), ve kterém budou soustředěny všechny typy proměnných z různých zdrojových systémů. Připravit takové prostředí pro segmentaci však přináší jisté záludnosti. Tou nejzásadnější je, kolik informací – atributů – chceme o zákazníkovi sbírat, sledovat a zahrnout do segmentačního rozhodování. Tím určujeme počet sloupců v klientském datamartu pro potřeby segmentace. Obvykle si nevystačíme jen s omezeným množstvím informací o klientovi v podobě desítky sloupců v datamartu, řádově se většinou pohybujeme na úrovni stovek. Ovšem pozor, neplatí čím více, tím lépe. Všechny atributy musí mít svou zdůvodnitelnou roli. Nesmíme také zapomínat, že všechny atributy musíme dlouhodobě udržovat aktuální a včas do nich promítnout změny.

Obr. 1: Různé úrovně datových zdrojů
Do datamartu obecně zahrnujeme informace několika typů – informace o produktech, o chování klienta, kontaktní údaje, sociodemografické údaje jako věk, pohlaví, vzdělání a podobně. Obecně platí, že právě k jednomu zákazníkovi patří k danému časovému okamžiku právě jeden řádek se všemi atributy.

Obr.2: Příklad struktury řádku o jednom zákazníkovi v klientském datamartu
Obr.2: Příklad struktury řádku o jednom zákazníkovi v klientském datamartu
Informace o produktech
Se základním typem informací – informací o produktech – bývá poměrně dost práce. Diskutabilní je zpravidla již sám číselník produktů a určení, na jaké hierarchické úrovni budeme data o produktech sbírat nebo agregovat. Musíme se tedy třeba v případě banky rozhodnout, zda budeme rozlišovat úvěry krátkodobé a dlouhodobé, nebo úvěry vázané k běžnému účtu (např. kontokorent, flexikredit, povolený debet), kreditní kartě, nemovitosti či dalším závazkům (konsolidace půjček). A obdobně to v bance může být se spořicími účty, běžnými účty, kreditními kartami a dalšími finančními produkty.
Behaviorální neboli transakční informace
O tom, jak se klient chová, nejčastěji získáváme informace z transakční historie klienta. Pokud uvažujeme klienta banky, který má běžný účet, popřípadě kreditní kartu, máme informace o aktuálním zůstatku, o počtech a typech transakcí. Dále můžeme doplnit různé statistiky o výši částky transakce (minimum, maximum, průměr). Transakční historii většinou sledujeme nejen za poslední měsíc, ale většinou po měsících za celé čtvrtletí nebo půlrok. Nesmíme zapomínat i na skutečnost, že klient může mít i několik účtů daného typu. Je tedy nutné evidovat jejich počet a zohlednit i sumarizační princip. Příkladem mohou být tři úvěry pana Dvořáka, jeden před rokem doplacený, druhý splácený po dobu pěti let, a třetí, čerstvý, pouze se dvěma splátkami. Skutečnost, že pan Dvořák uzavřel celkem tři úvěrové smlouvy, jedna již není aktuální, dvě jsou stále otevřené, s různými zůstatky, s různou výší splátky, s různou délkou úvěrového vztahu, to vše by se mělo v datech odrazit. To vše může totiž rozhodnout o rozřazení klienta do segmentů věnovaných (především) dlužníkům (klientům s úvěrem).
Informace o neplatičích
Tímto příkladem se dostáváme k důležitému údaji o klientech a tím je jejich vztah k dlužnosti, respektive doba po splatnosti, četnost jejího překročení a také výši dluhu. Neplatičům totiž zpravidla vytváříme speciální segment nebo segmenty.
Kontaktní údaje
Vzhledem k častému použití segmentace v marketingu je nutné dbát i na zařazení takových atributů, které nemusí vstupovat přímo do segmentačních pravidel, ale mohou zajišťovat kontakt na klienta. Jedná se především o aktuální telefonní číslo, doručovací adresu (v položkách minimálně jako PSČ, město, ulice, číslo domu), e-mail, ale i identifikaci používané služby internetového bankovnictví.
Další doplňkové údaje
Pro marketingové a produktové specialisty můžeme datamart obohatit i o sociodemografické údaje. U úvěrově orientovaných finančních společností většinou nebývá příliš mnoho komplikací se získáním těchto údajů, ale nastávají obtíže s udržením jejich aktuálnosti. Například po třech letech splácení půjčky formou spotřebitelského úvěru se může z paní Smutné stát paní Veselá, z bezdětné dvounásobná matka, ze svobodné rozvedená, z osoby s trvalým příjmem osoba nezaměstnaná atd. Pokud tedy vycházíme pouze ze základních údajů o klientovi na smlouvě, musíme předpokládat její zastarání. Na druhou stranu o klientech, s nimiž uzavíráme smlouvu neúvěrového typu, zpravidla tyto údaje vůbec neznáme (na smlouvě nejsou).
Mezi další zajímavé atributy, které doplňují informace o klientovi, patří údaje o ziskovosti či ztrátovosti klienta, popřípadě nákladech na jeho získání (provize, bonusy), udržení (např. slevy) apod.
Identifikace a unifikace
Důležitým aspektem pro úspěšnou segmentaci je, že se provádí napříč celou organizací, a tudíž s využitím velkého množství systémů. To s sebou samozřejmě přináší potřebu správně identifikovat klienty z různých zdrojů.
Například musíme být schopni zjistit, že Jan Novák, který si pořídil stavební spoření přes externího zprostředkovatele, je ten samý Jan Novák, který si o rok později založil běžný účet na pobočce v Pardubicích. Identifikace a unifikace klientů na úrovni občana, spoludlužníka, manžela/manželky, dítěte nebo podnikatele bývá tvrdým oříškem. Kartami může zamíchat i celá řada výjimečností, například změna pohlaví, a tudíž i jména klienta. Ohledy musíme brát i na zemřelé klienty, jejichž účty bývají ještě nějakou dobu aktivní.
Historické hledisko
Připravujeme-li datamart, nesmíme zapomenout, že nás zajímá i historický vývoj, tedy zpětný pohled na klienta. To znamená, že si pro každého klienta sestavíme několik měsíčních snímků za poslední rok. Základní informace zpravidla získáme z datového skladu, ale potřebujeme-li zachytit takové detaily, jako specifické transakce a operace na účtech, je to již obtížné, někdy i nemožné. Například sledovat, kolik plateb a v jaké výši uskutečnil klient v každém měsíci automaticky (SIPO, trvalý příkaz, inkaso), kolik internetovým bankovnictvím, kolik bankomatem a kolik platbou u obchodníka, není evidováno v každém datovém skladu, ale často musíme do primárních systémů. Při zachycování historie tedy nesmíme zapomenout na omezení, která nám přináší nahrávání dat z primárních systémů (tj. jejich zpomalování apod.).
Dalším úskalím zpětného pohledu jsou přirozené změny, které za poslední rok proběhnou. Například mohlo dojít ke změně struktury produktů, a tak se musí připravit několik verzí číselníků produktů a vhodná kategorizace.
Problémy s daty při pravidelném segmentování
Pokud máme data připravená na jednom místě ve výše nastíněné struktuře, pak můžeme přistoupit k pravidelnému segmentování klientského portfolia. To se uskutečňuje na základě segmentačních pravidel. Když je datamart vytvořen, sestavuje se konkrétní segmentační algoritmus na základě výsledků dataminingových úloh či na základě expertních analýz měsíčních snímků datamartu a požadavků business uživatelů. Jak často budeme spouštět segmentační algoritmus, záleží především na využití výsledků. Můžeme nastavit standardní měsíční výpočet, ale také se můžeme setkat s týdenní či denní aktualizací.
Čas od času je nutné segmentační pravidla jemně upravit, a to například z důvodu změny produktové struktury nebo strukturálních změn na trhu. Business uživatelé ale mohou požadovat změny většího charakteru, zejména se jedná o změny počtu segmentů, jejich rozdělení, změny jejich názvů (což může mít vliv například na reportování atd.).
To znamená nastavit segmentování tak, abychom mohli verzovat, následně spouštět a zpětně identifikovat jednotlivé verze segmentačních pravidel. Navýšení počtu segmentů může ovlivnit strukturu zapisování výsledků výpočtu. Musíme tedy být na změny připraveni, např. používat pro segmenty samostatný číselník. Vhodné je také zvážit, zda budeme při změnách segmentace využívat princip champion-challengeru (a sledovat případný vliv změn), tj. spouštět dva segmentační algoritmy (původní a nově navrhovaný). Ukládáním a porovnáním dvojích výsledků můžeme předcházet kolizím, například zavčas zjistit, že nový segmentační algoritmus některé klienty nezařadí do žádného segmentu.
Dalším faktorem pro správné a „bezchybné“ segmentování je vymezení, jací uživatelé (business, nebo jen IT?) budou mít možnost zasahovat do segmentačních pravidel. A také v jakém prostředí se tak bude dít.
Pro další využití výsledků segmentace je nutné vytvořit i prezentační vrstvu těchto dat. Nejen pro využití marketingem nebo útvarem rizik, ale aby se segment propisoval v call centru operátorovi na obrazovku, bankéři na pobočce atd.
Výpočetní prostředí musí také podpořit sledování trendů v segmentaci, což znamená, že musíme zajistit vytvoření sestav pro reportování a také systém varování. Monitoring by měl zavčas upozornit na překročení odchylek, například výrazné snížení počtu klientů v určitém segmentu.
Segmentace s profesionály se vyplatí
Připravit datovou platformu pro pravidelnou segmentaci klientů tedy není mávnutí kouzelného proutku a určitě je vhodné využít při segmentaci pomoc konzultantů, kteří mají s projekty tohoto typu řadu zkušeností. Nadefinovat strukturu dat v datamartu, sepsat segmentační algoritmus, zajistit ukládání výsledků segmentování, nahrát všechna data k prvnímu spuštění segmentování, zajistit pravidelný přenos dat, propojení do dalších systémů, údržbu a monitoring, to vše vyžaduje úsilí jak business, tak IT specialistů zapojených do daného projektu. Překonáme-li veškerá úskalí, otevře se nám cesta k možnosti vytvoření úspěšné segmentace a tím i zlepšení vztahu společnosti se zákazníky.
Dagmar Bínová, Šárka Krkošková
Autorky se ve společnosti Adastra věnují oblasti data miningu a pracovaly na několika projektech segmentace pro přední české společnosti.


![]() ![]() | ||||||
Po | Út | St | Čt | Pá | So | Ne |
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 1 | 2 | 3 | 4 |
5 | 6 | 7 | 8 | 9 | 10 | 11 |
Formulář pro přidání akce
15.5. | Konference SCADA Security |
22.5. | Akce pro automobilové dodavatele "3DEXPERIENCE... |
12.6. | Konference ABIA CZ 2025: setkání zákazníků a partnerů... |
29.9. | The Massive IoT Conference |