facebook LinkedIN LinkedIN - follow

Velká data a velké výzvy pro OpenShift

OpenShiftUmělá inteligence, strojové učení, velká data a jejich analýza - to jsou dnes velmi často skloňované termíny, které zahrnují rychle se vyvíjející oblasti a technologie, po kterých je v IT vysoká poptávka. Výzev, které tyto oblasti přináší a musí překonávat, je nespočet a spadají do mnoha kategorií, od těch vyloženě abstraktních matematických až po návrh specializovaného hardwaru umožňujícího výpočty urychlit.


Velká data přinášejí pro vývojáře ve všech oblastech zásadní výzvy. Jak nasadit specializovaný hardware do produkce? Jak zajistit kompatibilitu všech potřebných knihoven a komponent? Jak poskytnout přístup k potřebné infrastruktuře všem zainteresovaným osobám? Podobné výzvy je třeba řešit nejen v oblasti velkých dat a umělé inteligence, ale objevují se obecně v kontextu vývoje moderních cloudových aplikací. V cloudu, jak se zdá, vítězí Kubernetes, potažmo jejich podniková varianta OpenShift. Stojí tedy za to zvážit, do jaké míry je tato platforma aplikovatelná v prostředí velkých dat a umělé inteligence, případně jaké nové vlastnosti jsou do ní třeba implementovat.

“Pokud dnes začínáme vyvíjet aplikaci, která má škálovat, být nasazena napříč geografickými zónami a která se umí vypořádat se zásadními výpadky, pravděpodobně budeme hledat existující kontejnerovou platformu, která nám vývoj a provoz aplikace co nejvíce usnadní. Pro mnoho firem a vývojářů je takovou platformou Kubernetes a OpenShift. V případě umělé inteligence a strojového učení je nástup jednotné platformy pro nasazení poněkud opožděný. Mnoho z těch, kteří se věnují umělé inteligenci, nejsou vývojáři sledující nejnovější trendy. Jsou to vědci, kteří jsou špičky ve svém oboru, umí Python, Javu, nebo jiný programovací jazyk, případně znají trochu git. Nevědí ovšem, jak navrhnout CI/CD procesy, jak automatizovat nasazení a jak monitorovat aplikaci v produkčním prostředí,” upozorňuje Václav Pavlín, Principal Software Engineer ve společnosti Red Hat.

Také zprovoznit specializovaný hardware je většinou náročný úkol. A reprodukovat tuto konfiguraci v produkci je pak ještě komplikovanější procedura. Praxe ukazuje, že integrace a testování všech úrovní infrastruktury jsou klíčové. Proto je důležité se na to při výběru dodavatele platformy Kubernetes zaměřit - platformy jako Kubernetes nám mají práci ulehčovat, ne komplikovat. Integrátor hardwaru a softwaru by pak pro takovou platformu měl také poskytnout co nejvyšší stupeň automatizace a škálovatelnosti.

“Klíčovým prvkem v datové vědě obecně je sdílení a spolupráce. Nemluvíme jen o sdílení výsledků výzkumu, ale také o sdílení infrastruktury a výpočetních zdrojů. To platí v oblasti umělé inteligence dvojnásob, protože se často využívá nákladný specializovaný hardware. OpenShift jako platforma toto sdílení a spolupráci usnadňuje. Operační systém, virtualizace, síťování, na kterých OpenShift běží, musí spolupracovat, aby ono sdílení zdrojů umožnily,” říká Václav Pavlín.

Principy vzájemného fungování všech vrstev infrastruktury a zásadní přínosy společnosti Red Hat do oblasti umělé inteligence a velkých dat představí Václav Pavlín i na letošním českém Red Hat Fóru. V rámci své přednášky ukáže, jak lze snáze a více sdílet výpočetní zdroje a spolupracovat a ve spojitosti s tím snižovat náklady a zrychlit proces přechodu od nápadu k produkčnímu nasazení. Zúčastněte se Red Hat Fóra EMEA 2020 – v netradičním online formátu, pohodlně z domova a česky – a najděte tu správnou cestu pro vaše IT. Konference se koná 3. listopadu a registrace je zdarma.

Red Hat

V rámci vystoupení Václava Pavlína na Red Hat Fóru se dozvíte více i o projektu Open Data Hub (opendatahub.io), který se snaží výhody platformy OpenShift využít a ukázat. Tento meta-operator v sobě integruje populární technologie z oblasti umělé inteligence a zpracování dat a nabízí je uživatelům pomocí jednoduché instalace skrze OpenShift Operator Hub. Open source nástroje jako Jupyter, Tensorflow, Spark, ale i různé komponenty z projektu Kubeflow tak mají uživatelé k dispozici na několik kliknutí.