facebook LinkedIN LinkedIN - follow
IT služby - Outsourcing IT , AI a Business Intelligence

Data warehouse jako služba

Jan Medek


V IT službách se dnes stále častěji potkáváme s fenoménem cloud computingu. Cloud computing může mít různé podoby od SaaS přes PaaS až k IaaS a s trochou nadhledu až po běžný (web)hosting. Mezi hlavní obecné výhody cloud computingu patří úspora nákladů za hardware a software, úspora za IT administrátory, IT specialisty na správu a rozvoj systému, krátká doba implementace a další. S cloud computingem zákazník získá celý systém a jeho nasazení jako službu a platí za používání této služby.


Oblast datových skladů je poměrně specifická. Typický datový sklad obsahuje velké množství firemních dat, aby dokázal uspokojit informační potřeby mnoha útvarů ve firmě, poskytnout jednotný pohled na zákazníka, služby, výnosy firmy, poskytnout data pro data mining atd. Datový sklad obsahuje také dlouhou historii dat, mnohem delší než transakční (z pohledu datového skladu zdrojové) systémy, aby bylo možné vytvářet různé trendové analýzy, zkoumat chování zákazníků v čase, předpovídat jejich odchod (churn) apod.
Pokud budeme uvažovat typický cloud computing jako situaci, kdy se IT infrastruktura „cloudu“ nachází mimo IT prostředí firmy a cenové modely jsou založené na objemu přenesených dat a/nebo spotřebovaného času cloudu, je vidět, že je třeba řešit určité protichůdné požadavky.

Objem přenášených dat

Business uživatel typicky požaduje, aby v datovém skladu byla „všechna“ data. Na druhou stranu za přenesená data do cloudu bude platit podle jejich velikosti. Je tudíž třeba si zodpovědět otázky typu:
  • Opravdu potřebuji v datovém skladu všechna data, která moje IT systémy produkují?
  • Skutečně je využívám pro svoje analýzy a přináší mi nějakou hodnotu?

Rychlost připojení

S objemem požadovaných, respektive skutečně přenášených dat souvisí i otázky rychlosti přenosu. Čím více dat se bude přenášet, tím déle to bude trvat. Pak je vhodné zodpovědět si otázky jako:
  • Jak rychlé a kvalitní je moje datové připojení?
  • Budu data přenášet denně, nebo v měsíčních dávkách?
  • Stihnu to během noci, respektive mimo business hodiny?

Přístup ke cloudu a bezpečnost

V oblasti cloud computingu pro datové sklady lze sledovat trend návratu spíše ke Kimballovskému modelu jednotlivých (malých) datamartů v cloudu a případně jejich postupnému spojování.
Přístup firem ke cloudu je ovlivněn i otázkami důvěry v cloud a bezpečnosti. Cloud computing je přece jen poměrně nová disciplína a pohled tradičních velkých firem, jako například bank, na novinky v IT je poněkud konzervativní. To znamená, že musí uplynout poměrně dlouhá doba, než poskytovatel vychytá všechny dětské nemoci a technologie či služba se stane důvěryhodnou i u těchto velkých zákazníků.
Další velkou kapitolou je bezpečnost a s ní související ochota poslat svoje data mimo vlastní IT prostředí. Vedle již zmíněné obecné nedůvěry mají firmy, nyní v roli správců dat, legislativní povinnosti, jak s daty zacházet a poskytovatel cloudu musí garantovat splnění těchto povinností. Více než kde jinde je nutné precizní SLA definující povinnosti poskytovatele služby.

Pro koho je cloud

Na základě uvedených vlastností budou typickými zákazníky datového skladu v cloudu:
  • menší firmy, které nepracují s velkými objemy dat,
  • start-upy, které ještě nemají mnoho dat, nebo které i všechna svá business data zpracovávají pomocí cloud computingu,
  • úlohy, které nepracují s velkými daty, jako například vývojová a testovací prostředí,
  • malé datamarty, které se rychle nahrávají/updatují,
  • ad-hoc analýzy, které vyžadují jen jednorázový import dat.

Cloud computing přesouvá péči o IT a náklady s tím spojené od zákazníka k poskytovateli služby
Cloud computing přesouvá péči o IT a náklady s tím spojené od zákazníka k poskytovateli služby

Řešení dostupná na trhu

Na trhu již existuje několik dodavatelů, kteří nabízejí služby cloud computingu pro datové sklady, nebo alespoň část této úlohy. V zásadě můžeme nalézt dvě skupiny nabízených řešení:

Business intelligence (BI)

V tomto případě poskytovatel nabízí službu reportingu, tzn. zákazník má možnost nahrát potřebná data a přes webové rozhraní vytvořit požadované reporty. Webové rozhraní typicky poskytuje možnosti jednoduchého OLAP nástroje, umožňuje zobrazit data ve formě tabulky nebo grafu různých podob, filtrovat dle jednotlivých dimenzí, přidávat sumace, případně jednoduché výpočetní operace, ukládat reporty do běžných formátů (např. XLS, PDF).
Velkou výhodou je jistě dostupnost takových reportů z jakéhokoliv počítače připojeného k internetu, možnosti sdílení mezi uživateli a to s možným nastavením práv (např. jen pro čtení nebo s možností úprav).
Určitou nevýhodou může být nutnost připravit data do extraktu nějaké vhodné podoby, tzn. je nutné určité úsilí na získání dat z primárních systémů a jejich transformaci nebo jinou přípravu.

Kompletní datový sklad

V tomto případě poskytovatel nabízí zajištění celého procesu od analýzy zdrojových dat, přes transformační proces a vytvoření datového skladu až po reporting. Takovýchto poskytovatelů je na trhu v současné době výrazně méně, ale dá se očekávat, že jich časem bude přibývat.

Výhled do budoucna

Datový sklad (nebo BI) jako služba je zatím jako dítě. Část jeho okolí ho vnímá s nedůvěrou a čeká, co z něho vyroste, část je z něj nadšena již dnes a intenzivně s ním pracuje. Doufejme, že stejně úspěšně jako překonalo dětské nemoci, projde i pubertou. Dospělé bude mít jistě co nabídnout i těm, kteří mu dnes nedůvěřují. Jako i v jiných případech bude úspěch této služby záviset na tom, kolik zákazníků zaujme a přesvědčí.


Cloud computing

Cloud computing je na internetu založený model vývoje a používání počítačových technologií. Lze ho také charakterizovat jako poskytování služeb či programů uložených na serverech na internetu s tím, že uživatelé k nim mohou přistupovat pomocí webového prohlížeče a používat ho prakticky odkudkoliv. Uživatelé neplatí (za předpokladu, že je služba placená) za vlastní software, ale za jeho užití. Nabídka aplikací se pohybuje od kancelářských aplikací přes systémy pro distribuované výpočty až po operační systémy provozované v prohlížečích, jako je například eyeOS či Cloud. Cloud computing se skládá ze tří modelů:
  • IaaS – infrastruktura jako služba (Infrastructure as a Service) – v tomto případě se poskytovatel služeb zavazuje poskytnout infrastrukturu. Typicky se jedná o virtualizaci.
  • PaaS – platforma jako služba (Platform as a Service) – poskytovatel v PaaS modelu poskytuje kompletní prostředky pro podporu celého životního cyklu tvorby a poskytování webových aplikací a služeb plně k dispozici na internetu, bez možnosti stažení softwaru.
  • SaaS – software jako služba (Software as a Service) – aplikace je licencována jako služba pronajímaná uživateli. Příkladem může být známá sada aplikací Google Apps.

  • Zdroj: Wikipedie


    Autor působí jako senior konzultant společnosti Adastra.
    Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.

    Inzerce

    Pět způsobů, jak AI změní náš svět k nepoznání

    AI_analyzuje_data-PR.jpegUmělá inteligence (AI) a strojové učení (ML) přináší už více než 10 let podnikům i výzkumníkům stále možnosti. Ať už jde o využití prediktivní analýzy k předvídání údržby zařízení, nástroje počítačového vidění, které dávají oči robotům na automatických montážních linkách, nebo digitální dvojčata sloužící k simulaci fungování továren, měst, a dokonce i celých ekonomik, seznam aplikací poháněných AI je dlouhý a stále se prodlužuje.