Cloud se zhroutil: Amazon Web Services způsobily celosvětový chaos
Ráno 20. října kolem půl osmé našeho času začaly přibývat stížnosti na nefunkční aplikace a weby. Uživatelé po celém světě hlásili, že jim nefunguje přihlášení do Snapchatu, Amazon Alexa nereaguje na hlasové povely a chytré kamery Ring se odpojily od sítě. Brzy se ukázalo, že všechny problémy spojuje jediný zdroj - výpadek infrastruktury Amazon Web Services, zkráceně AWS.
AWS je dnes páteří velké části internetu. Na jejích serverech běží nejen aplikace od samotného Amazonu, ale také systémy tisíců firem a institucí. V Severní Virginii, kde se nachází jeden z hlavních regionů AWS s označením „US-EAST-1“, došlo k rozsáhlému selhání síťové infrastruktury. Amazon potvrdil operační problém, na jehož odstranění okamžitě nasadil své inženýrské týmy.
Dopady po celém světě
Během několika minut začaly výpadky zasahovat služby v různých částech světa. Uživatelé Redditu hlásili chyby při načítání obsahu, platforma Venmo neumožňovala platby a některé banky z preventivních důvodů odpojily své systémy. Potíže měly i streamovací platformy a populární hra Wordle, která běží na infrastruktuře AWS.
Výpadek se netýkal jen zábavy - ovlivnil i firmy, které využívají cloud Amazonu k provozu svých webů nebo e-shopů. Krátkodobě vypadly interní systémy zákaznické podpory, logistické aplikace a rezervační systémy. I když šlo o několik hodin, dopad na důvěru v cloudové služby byl znatelný.
Proč se to stalo
Přesná příčina výpadku zatím nebyla oficiálně zveřejněna. Odborníci se však shodují, že šlo o technickou závadu spojenou s přetížením sítě nebo problémem v DNS systémech. Neexistují žádné důkazy, že by šlo o hackerský útok. Amazon během dopoledne oznámil, že většina služeb byla obnovena, i když některé systémy se plně stabilizovaly až v podvečer.
Zdroj: Shutterstock
Incident znovu ukázal, jak obrovská je závislost internetu na několika málo poskytovatelích infrastruktury. Amazon, Google a Microsoft společně pokrývají většinu světového cloudu. Pokud selže jeden z nich, následky pociťují i ti, kteří s danou firmou nemají nic společného.
Lekce z výpadku
Experti upozorňují, že výpadek z 20. října by měl být varováním. Centralizace internetu sice přináší efektivitu a nižší náklady, ale zároveň vytváří riziko dominového efektu. Když se zhroutí jeden region, jeho důsledky se mohou rozšířit po celém světě.
Řešením by mohl být multicloudový přístup – tedy kombinace více poskytovatelů najednou. Jenže pro mnoho firem je tato strategie nákladná a technicky složitá. Proto většina stále sází na jediného partnera, a tím často bývá právě Amazon. Do večera téhož dne Amazon oznámil plné obnovení provozu.