Aktuality -> Analýzy - Dnes - Jan Skalla

Jaké ponaučení si vzít z výpadků Cloudflare?

Multi-cloud může pomoci, ale není to všelék

Hned dva globální výpadky služby Cloudflare v nedávné době opět ukázaly, že ani největší světoví hráči nejsou imunní vůči interním chybám. V obou případech šlo o konfigurační změny, které se rozšířily na celou síť dřív, než se projevil problém – klasický failure mode distribuovaných systémů.



Kdo to pocítil nejvíc?

Výpadky služby Cloudflare, které nastaly 18. listopadu na cca 5,5 hodiny a 5. prosince na cca 25 minut nejvíce zasáhly e-shopy a SaaS služby s vysokou závislostí na real-time dostupnosti. Podle našich interních dat jsme u některých klientů zaznamenali 100% nedostupnost po dobu incidentu. U větších e-shopů to může znamenat ztráty v řádu desítek tisíc korun za minutu – konkrétní čísla se ale dramaticky liší podle segmentu, marže a denní doby. Finanční sektor a kritická infrastruktura byly zasaženy méně, většinou díky existujícím multi-vendor řešením a přísnějším regulatorním požadavkům.

Dopad každého výpadku se zvyšuje

Podle reportu Parametrix vzrostl počet kritických incidentů u top 3 cloud providerů (AWS, Azure, GCP) o 18 % v roce 2024 oproti 2023. Důležité ale je, že současně dramaticky roste objem služeb běžících v cloudu a závislost na něm – takže relativní spolehlivost se nemusí zhoršovat tak výrazně, jak absolutní čísla naznačují. Co se ale určitě zhoršuje, je dopad každého jednotlivého výpadku, protože více byznysu závisí na méně providerech.

Multi-cloud může pomoci, ale není to všelék

Klientům, pro které takový výpadek představuje citelné ztráty, doporučujeme zvážit aktivní multi-CDN/multi-cloud strategii. Je ale fér říct, co to obnáší:
  • Vyšší provozní náklady – platíte za redundanci, kterou většinu času nevyužijete. U menších projektů může roční cena multi-CDN setupu převýšit očekávané ztráty z výpadků.
  • Komplexita – debugování problémů napříč providery je výrazně těžší. Potřebujete lidi, kteří rozumí více platformám, a unified monitoring, který není triviální postavit.
  • Nové failure modes – multi-cloud setup může selhat koordinovaně (společná závislost na DNS, certifikátech, nebo třeba na tom samém podmořském kabelu). Přidáváte resilience, ale také nové vektory selhání.

Co má smysl pro koho?

  • Pro velké e-shopy a SaaS s vysokými náklady na výpadek (řádově statisíce Kč/hodinu a více) dává smysl investovat do aktivního multi-CDN s automatickým failoverem a hybridního modelu s lokálním DC jako fallbackem.
  • Pro střední projekty může být rozumnější pasivní připravenost – mít otestovaný plán B, který aktivujete manuálně, místo plně automatizovaného (a drahého) řešení.
  • Pro menší projekty je často nejefektivnější přijmout, že občasný výpadek je součást života, a investovat spíš do rychlé komunikace se zákazníky a kompenzačních mechanismů.

Vendor-neutrální nástroje pomáhají, ale nejsou magie

Kubernetes, HAProxy, Nginx nebo BGP routing skutečně usnadňují přenositelnost a snižují vendor lock-in. Zároveň ale přinášejí vlastní provozní komplexitu – Kubernetes cluster vyžaduje netriviální expertízu a sám o sobě může být zdrojem výpadků. Cílem by nemělo být „zbavit se závislostí" (to nejde), ale vědomě si vybrat, na čem závisíte, a mít plán pro případ selhání.

Závěr

Kdo dnes spoléhá pouze na jednoho globálního poskytovatele, přijímá riziko, že jeho další výpadek bude i vaším výpadkem. Jestli je to akceptovatelné riziko, záleží na konkrétním byznysu. Důležité je, aby to bylo vědomé rozhodnutí, ne jen důsledek setrvačnosti.
 
Jan Skalla
Autor článku působí na pozici Innovation Tech Lead ve společnosti MasterDC.

 


 
  

- PR -

Repasované notebooky: Kupte chytře a šetřete při tom přírodu

Potřebujete nový notebook, ale nechce se vám utrácet zbytečně? Repasované notebooky nabízejí výkon prémiových značek za zlomek původní ceny. Navíc jsou ekologickou volbou a všechny prošly důkladnou kontrolou. Zjistěte, proč se vyplatí vsadit právě na repasy.

  

- PR -

Phoenix a BENU lékárny sjednotily komunikaci s více než 430 pobočkami díky ALVAO

Společnost PHOENIX lékárenský velkoobchod, s.r.o., provozující síť lékáren BENU, potřebovala zjednodušit a sjednotit komunikaci mezi centrálou a lékárnami. Implementací ALVAO Service Desk a Asset Management získala přehledné řešení pro správu požadavků i majetku, které přineslo rychlejší komunikaci, vyšší efektivitu a lepší podporu napříč celou organizací.