facebook LinkedIN LinkedIN - follow
PříLOHA 6/2001

Bezpečnost data warehouse

Milan Kučera





Data warehouse je svým způsobem zvláštní. Na jedné straně je obrovské očekávání koncových uživatelů o využívání dat v něm uložených a na straně druhé, která jde svým způsobem proti tomuto očekávání, je bezpečnost dat datového skladu. V počátcích budování datového skladu obvykle nejsou implementována výraznější bezpečnostní opatření. Tato opatření jsou postupně přidávána do architektury datového skladu. Snaze chránit data v datovém skladu je zcela pochopitelný požadavek, ale je vždy nutné najít vhodnou formu, jak tuto bezpečnost zajistit. A o tom, je tento článek.

Datový sklad obsahuje informace o základních obchodních entitách jako KLIENT, PRODUKT, TRANSAKCE, ÚČET, a další, řekněme geografické údaje. Podíváme-li se na uvedené entity, pak z hlediska bezpečnosti, jsou zajímavé entity KLIENT, ÚČET a TRANSAKCE neboť obsahují citlivé údaje, k nimž by neměli mít přístup všichni uživatelé datového skladu. V každém oboru bychom našli údaje, které jsou vysoce důvěrné, jako např.:

. diagnóza pacienta
. plat zaměstnance společnosti
. finanční informace, a další.

Datový sklad představuje systém, v němž jsou uložena integrovaná, validovaná, detailní data z několika informačních systémů, která jsou navíc snadno dostupná. Jak jsme uvedli, představují např. finanční údaje jedny z citlivých údajů, které může neoprávněná osoba využít ve svůj prospěch. Představme si člověka, který má za svého koníčka provádění finančních analýz. Datový sklad mu poskytuje veškeré informace a tento člověk zjistí, že firma v poslední době ztrácí peníze. Tento "finanční analytik" pak může tuto informaci požít na burze cenných papírů ke svému prospěchu. Podobné příklady neoprávněného použití dat lze najít i jinde.

Bezpečnostní strategie data warehouse
Předpokládejme, že jsme během několika iterací vybudovali datový sklad, který pokrývá definované požadavky koncových uživatelů. Pro podporu rozhodování jsme vybudovali základní architekturu data warehouse, která je tvořena prvky Corporate Information Factory (CIF) [1], a to:

. produkční systémy
. ETL vrstva
. data warehouse
. koncová aplikace.

Data warehouse jsme realizovali na určitém hardware v prostředí relační databáze, kterou obvykle bývá NCR - Teradata, Oracle, IBM - UDB2, či jiné. K tomu, abychom mohli definovat bezpečností strategii datového skladu je potřebné učinit několik základních kroků, kterými jsou:

. Identifikace bezpečnostních potřeb
. Identifikace úrovní zabezpečení
. Identifikace uživatelů a jejich potřeb
. Formulování bezpečnostní politiky.

Identifikace bezpečnostních potřeb slouží k vymezení obchodně citlivých dat a nastavení priorit bezpečnosti s ohledem na jejich obchodní význam. Dále identifikujeme skupiny uživatelských požadavků na přístup k datům. Bezpečnostní požadavky mohou vycházet z významu informačního systému jež zpracovává příslušná obchodní data. To znamená, že systém obsahující velmi citlivá data, která jsou následně poskytována datovému skladu znamenají nastavení vysoké priority na ochranu a bezpečnost těchto dat.

Identifikace úrovně zabezpečení systému představuje další krok na cestě k nastavení bezpečnosti datového skladu. Existují určité úrovně zabezpečení, která s sebou přináší určité výhody na jedné straně a nevýhody na straně druhé. V rámci této etapě bychom měli najít vybalancované řešení pro nastavení bezpečnosti a to i s ohledem na chod celého systému.

V etapě "Identifikace koncových uživatelů a jejich potřeb" se zabýváme bezpečností systému (datového skladu) z pohledu koncového uživatele, tj. vlivu úrovně zabezpečení pro jeho činnost. V tomto kroku identifikujeme nejen jednotlivé uživatele systému, ale zároveň definujeme skupiny uživatelů. Uživatele datového skladu můžeme obecně rozdělit do tří základních skupin, a to:

. turisté
. farmáři
. výzkumníci,

které se od sebe liší frekvencí přístupu k systému, objemem zpracovávaných data, používanou úrovní detailu dat apod.. Na základě tohoto členění můžeme jednotlivé koncové uživatele zařadit do jednotlivých skupin.

Závěrečnou fází, před vlastní realizací bezpečnosti data warehouse, je formulování Bezpečnostní politiky datového skladu. Jestliže máme definovány bezpečnostní potřeby na systém, které jsme "vybalancovali" s ohledem na koncového uživatele, pak nám nic nebrání k tomu, abychom definovali bezpečnostní politiku, kterou můžeme rozdělit na dvě části, a to:

. systémová bezpečnost
. uživatelská bezpečnost.

V rámci systémové bezpečnosti se zaměřujeme na vysvětlení důvodu, proč je potřebná bezpečnost, její přínosy s ohledem na koncového uživatele, přínosy bezpečnosti pro firmu a definování doporučených a požadovaných bezpečnostních pravidel pro datový sklad.

V druhé části dokumentu zaměřené na uživatelskou bezpečnost se soustředíme na definici koncových uživatelů, jejich charakteristiku a nastavení bezpečnostních pravidel. Koncové uživatele můžeme rozdělit do určitých skupin a k nim následně asociovat jednotlivé uživatele. To znamená, že je potřebné definovat přístupová oprávnění např. DW administrátora, Vývojového pracovníka, Systémové inženýra atd. Tato část dokumentu tedy obsahuje prvky bezpečnosti aplikované na jednotlivé uživatele a skupiny uživatelů.

Bezpečností politika datového skladu není statickým dokumentem a to z několika důvodů, mezi které patří:

. migrace uživatelů
. rozšiřování datového skladu s ohledem na jeho vypovídací schopnost, tzn. "přídávání" předmětových oblastí
. vytváření útvarových či specializovaných databází
. nová verse systému, apod.

Z tohoto důvodu je vhodné v definovaných cyklech revidovat a aktualizovat tento dokument, který může být vyžádán vnitřním auditem při provádění auditu informačně technologického prostředí.

Prvky bezpečnosti data warehouse
Klíčovými prvky zajišťující bezpečnost a následně auditovatelnost systému jsou:

. logování do systému
. nastavení přístupových oprávnění
. zpřístupnění data warehouse prostřednictvím view
. enkryptování data v tabulkách data warehouse.

Logování do systému
Abychom zpřístupnili koncovému uživateli datový sklad, musí získat přístupová oprávnění do vlastního systému (převážně UNIX) a následně do vlastního prostředí datového skladu, tedy příslušné RDBMS.

Uživatelé systému dostávají své uživatelské jméno a přidělené heslo. Je vhodné, aby heslo do systému na němž je provozován datový sklad nebylo shodné s uživatelským jménem a heslem používaných při přístupu k vlastní databázi datového skladu.

Databázové systémy obsahují systémové tabulky, které uchovávají informace o akcích uživatele, tj. monitorují přihlášení / odhlášení uživatele, ukládají informace o tom s jakými tabulkami pracoval, jaké operace prováděl a také informace o tom, jaký SQL dotaz byl spuštěn. Uživatel RDBMS může ovlivnit množství informací ukládaných do systémových tabulek nastavením vlastností pro audit systému. V případě úplného auditu systému musíme mít na zřeteli, že při velkém počtu uživatelů mohou být systémové tabulky velmi rozsáhlé a proto je současně nutné nastavit pravidla pro archivaci, jejich uložení do jiné databáze sloužící k účelům monitorování data warehouse. Může se samozřejmě také jednat o odmazávání dat z těchto tabulek, opět, v definovaném cyklu.

Z hlediska bezpečnosti je vhodné prostřednictvím systémových prostředků nutit uživatele, aby po určité době měnil svá přístupová hesla do systému.

Přístupová oprávnění
Abychom umožnili koncovému uživateli pracovat s daty datového skladu, přidělujeme mu určitá přístupová oprávnění. Tato můžeme definovat na třech úrovních a to: na úrovní operačního systému, úrovni databáze, a úrovni tabulky databáze. Většina uživatelů bude pouze číst data prostřednictvím nějakého koncového nástroje, kterým může být jak MS Access, MS Excel tak i sofistikovanější nástroje jako COGNOS, MicroStrategy, a další.

View jako bezpečnostní prvek
Zajímavým způsobem podpoření bezpečnosti datového skladu je "odstínění" koncového uživatele od vlastního datového skladu prostřednictvím pohledů (view). Samozřejmě, že tento bezpečnostní prvek má vliv do vnitřní struktury datového skladu, která pak může vypadat následovně.

Pohledy, jako bezpečnostní prvek, je možné použít pouze v tom případě, kdy jsou zcela přesně známy požadavky koncového klienta.

Enkrypce dat - sofistikovanější přístup k bezpečnosti
Mnohem sofistikovanějším přístupem k zajištění bezpečnosti dat v datovém skladu je enkryptování dat. Enkrypci dat lze provádět na úrovni tabulky, záznamu či sloupce v tabulce databáze. V případě volby enkryptace dat musíme mít na mysli další skutečnosti, které mohou ovlivnit funkčnost celého datového skladu. V našem případě to znamená věnovat zvýšenou pozornost primárním a cizím klíčům, neboť při jejich enkryptaci může dojít k porušení integrity databáze. Porušení integrity databáze pak následně vede k tomu, že nebudou existovat vazby mezi tabulkami, které před enkryptací dat existovaly, tj. nebudeme moci napsat např. SQL příkaz pro následující tabulky, viz. obrázek 3, jestliže primární klíče byly enkryptovány.

Enkryptace dat tak má dobře definovaný vliv na manipulaci s daty. V případě enkryptovaných dat není možné provádět s těmito daty manipulace prostřednictvím standardního SQL. Abychom toto byli schopni provést potřebujeme mít k disposici dekryptovací program, který převede data do "čitelného" formátu.

Teprve s "čitelnými" daty jsme schopni manipulovat. Dopady enkryptace do aktualizace dat v datovém skladu jsou v případě přímé enkryptace dat zcela zřejmé.

Závěr
Systémy pro podporu rozhodování (DSS) obsahují integrovaná data z různých informačních systémů společnosti, které jsou integrovány do jednoho celku, zvaného data warehouse. Tak se data warehouse stává "datovou knihovnou" společnosti, která poskytuje data s různými úrovněmi citlivosti. Do života těchto systémů také zasáhl nový zákon o ochraně osobních údajů a tak lze očekávat, že společnosti mající datového sklady s těmito informacemi je budou muset řešit. Prostřednictvím data warehouse se dostáváme ke "všem" datům firmy, je tedy nutné implementovat určité prvky bezpečnosti s nimiž jsme se vás snažili prostřednictvím tohoto článku seznámit.

Ne všechny problému mohly být popsány do hloubky. Naší snahou bylo upozornit na problematiku bezpečnosti a její vztah k data warehouse. Pokud vám článek poskytl základní informace o bezpečnosti data warehouse, pak se naplnil záměr tohoto článku.

[1] Bill Inmon, Claudia Imhoff: Corporate Information Factory, JWS 1999

Chcete získat časopis IT Systems s tímto a mnoha dalšími články z oblasti informačních systémů a řízení podnikové informatiky? Objednejte si předplatné nebo konkrétní vydání časopisu IT Systems z našeho archivu.


Inzerce

Transformace bankovnictví a pojišťovnictví v éře umělé inteligence

Umělá inteligence se stala hy­ba­te­lem digitální revoluce ve finančním sektoru. Přináší bezprecedentní možnosti automatizace, personalizace služeb a optimalizace rizik. Přestože potenciál AI je enormní, jen malá část bank má připravenou komplexní strategii pro její implementaci.