facebook LinkedIN LinkedIN - follow
IT SYSTEMS 11/2011 , AI a Business Intelligence

Master data management



Tento článek uvede čtenáře do problematiky master data managementu (MDM, řízení kmenových dat) a představí koncept řešení této disciplíny MDM v nástroji webMethods OneData společnosti Software AG.


Definice MDM a business case

Kmenová data (master data) definuje nezávislá analytická společnost Gartner jako „konzistentní a jednotný soubor identifikátorů a dalších atributů, které popisují hlavní subjekty podniku a jsou sdíleny mezi různými business procesy“. Typickými master daty jsou údaje o zákaznících, produktech, výrobcích, dodavatelích a službách.
Jiná analytická společnost Forrester definuje MDM jako „schopnost organizací identifikovat správná kmenová neboli master data a využít je pro zlepšení byznys procesů a rozhodování“. MDM se zabývají organizace, které chtějí konsolidovat a lépe řídit svá kritická data. Důvodů pro lepší řízení dat najdeme jistě mnoho, ale nejčastěji se jedná o omezení rizika snížení tržeb nebo neefektivity organizace z důvodu nekvalitních a nepřesných dat, o potřebu zlepšit služby směrem k zákazníkům nebo o realizaci integračních projektů spojených s úsporou nákladů a akvizicemi.
Z pohledu komerční společnosti se MDM snaží předcházet situacím, jako jsou nesprávná komunikace se zákazníkem, chyby v dodávkách zboží a služeb způsobené nesprávnými údaji nebo nedostatečná přesnost a kvalita reportování.

Kvalifikace dat

 

Software AG


Data organizací můžeme pro potřeby MDM kvalifikovat do tří skupin:

  1. Transakční data – uchovávají záznamy o jednotlivých aktivitách v business procesech organizace. Tyto data primárně vznikají v provozních systémech a typicky nejsou sdílena s ostatními provozními systémy. MDM proces tyto data obvykle přímo neovlivňuje.
  2. Operativní data – přiřazují transakčním datům vazby k subjektům – zákazníkům, dodavatelům, zaměstnancům a dalším. Oproti transakčním datům jsou ale operativní data mezi systémy sdílená, nebo by alespoň být mohla. MDM proces nad operativními daty je pro úspěšnou implementaci nových systémů nebo jejich integraci v nějaké podobě nutností. Ovšem druhou věcí je udržení MDM procesu a kvality data i po skončení implementace.
  3. Analytická data – zatřiďují operativní data do větších celků, nad kterými je možné reportovat a řídit je. Typickým příkladem jsou země, regiony, kategorie produktů a další. Tyto data vstupují do provozních systémů v rámci implementace, nebo obchodních rozhodnutí. MDM proces je i pro tuto skupinu dat velice důležitý právě pro zachování přesného reportování.

Data můžeme rozlišit také podle oblastí, které popisují – datových domén. Data o zákaznících budou patřit do zákaznické domény, produktová data do produktové domény a tak dále. Data se mohou mezi doménami částečně překrývat. Adresa tak například může spadat do domény zákazníků i dodavatelů. MDM systémy by měly být schopny pracovat s více doménami a umět si poradit i s překrývajícími se daty z více domén.
Velké organizace pracují s daty v mnoha různých aplikacích a systémech – v ERP systémech, databázích, excelovských tabulkách, modelovacích nástrojích, ETL nástrojích a dalších. Data v těchto aplikacích mají různou formu, sledovanou úroveň detailu, případně i význam. Tyto informace o datech jsou popsány v metadatech. Metadata jsou implicitně součástí aplikací, ale často nebývají dostupné pro okolí této aplikace a není možné je jednoduše porovnávat mezi různými aplikacemi. MDM vrstva plní účel sdíleného repozitáře metadat. Je možné z ní získat formát dat, úroveň detailu a význam dat v různých aplikacích, včetně pravidel převodu mezi nimi a možností obohacení dat z jiných aplikací.

MDM technická vrstva

MDM řešení v podání Software AG webMethods OneData je technicky realizováno jako vrstva mezi aplikacemi, která obsahuje repozitář s definicí logických datových struktur ve formě entit a atributů. Součástí této definice logických struktur je také popis jejich metadat, pravidel pro čištění a obohacování dat, schvalovací procesy nad těmito daty a v neposlední řadě vazby na konkrétní datové struktury aplikací a systémů.
Konkrétní data aplikací a systémů je možné primárně udržovat buď v MDM, nebo v jejich původní aplikaci a prostřednictvím MDM se na ně pouze odkazovat. Všechny tyto struktury jsou uloženy v relační databázi ve zdokumentovaném a otevřeném schématu, ke kterému je možné přistupovat přímo, nebo přes integrační rozhraní.

Software AG

 

Proces MDM

V tomto článku jsem již několikrát zmínil, že MDM je proces získávání správných dat a udržení jejich kvality.
Prvním krokem v tomto procesu je definice správných dat včetně jejich popisu a kvalifikace. Tento krok se skládá ze dvou pohledů – business pohledu, který definuje data v návaznosti na business procesy, ve kterých tato data figurují (AS-IS), nebo figurovat mají (TO-BE). Druhý pohled je IT systémový, který vychází z toho, jaké jsou požadavky IT systémů na data. Je možné začít kterýmkoli z nich, ale nakonec je potřeba v definici dat zahrnout oba pohledy. Na tomto kroku se tedy podílejí jak lidé z byznysu, tak lidé z IT.
Druhým krokem je integrace aplikací a systémů s MDM vrstvou. Způsob integrace bude ovlivněn přístupem k MDM vrstvě. Pro jednoduchost budeme uvažovat dva základní přístupy – centralizovanou MDM vrstvu, odkud budou aktualizovány data v aplikacích, a konsolidační přístup, při kterém budou data naopak z mnoha systémů konsolidována do MDM vrstvy. Existují i další přístupy, které mohou být různou kombinací těchto dvou základních.

Software AG


MDM repositář je rozdělen na dvě oblasti – pracovní (work area) a produkční (release area). Data z aplikací jsou integrována do pracovní oblasti, kde jsou na ně aplikovány čisticí a další pravidla. Do této oblasti, také oprávnění uživatelé zadávají požadované změny kmenových dat. Po částečně, nebo úplně automatizovaném zpracování těchto dat jsou spuštěny schvalovací workflow, která uvolní data do produkční oblasti repozitáře. Odkud jsou potom data předány aplikacím a systémům.
Role IT pracovníků v druhém kroku MDM procesu spočívá v integraci dat aplikací a MDM repositáře. Integraci dat je možné realizovat pomocí dávkového načítání, nebo okamžitými aktualizacemi voláním rozhraní MDM repositáře. Tím je možné zajistit aktualizaci dat v takřka reálném čase.
Business uživatelé jsou ale vlastníci dat, kteří mohou pomocí webového rozhraní data vyhledávat, provádět nad nimi analýzy a také je modifikovat. Modifikace dat v MDM repositáři místo v produkční aplikaci nebo systému přináší výhodu komplexního přehledu o datech. Pracovníci mohou tedy využít už existující entity a atributy, místo vytváření nových redundantních dat. Business uživatelé také plní hlavní roli ve schvalovacím workflow, které uvolňuje data do produkční oblasti.
Pro uchování běžícího MDM procesu je důležité přijmout fakt, že kvalita dat není stálá v čase. Pokud nebude nastaven pravidelný udržovací MDM proces, bude se kvalita dat časem zhoršovat a efekty z nasazení MDM řešení snižovat. Kvalitní MDM proces se tedy zdá důležitější než okamžitá kvalita dat.

Závěr

Z potřeby udržovat běžící MDM proces, aby se časem opět nezhoršila kvalita dat, vyplývá, že MDM není dobrý kandidát na samostatný a časově ohraničený projekt. Výhodou ale je, že MDM je možné budovat postupně, ať už z pohledu integrovaných aplikací a systémů, nebo z pohledu datových domén. To činí z MDM ideální součást projektů implementace a integrace systémů, kdy je nutné danou oblast stejně zmapovat.
MDM není novinka a již mělo možnost prokázat reálné úspory nákladů a přínosy businessu u mnoha zákazníků. MDM řešení nezůstávají stát na místě, ale vyvíjejí se. Umožňují mnoha uživatelům souběžně pracovat s různými oblastmi dat – doménami. Stejně tak se vyvíjejí možnosti integrace dat a změny v rámci aplikací je možné provádět v takřka reálném čase.

Vojtěch Patrný
Autor působí na pozici competence leader ve společnosti Software AG.

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.