Facebook s šest urnim izpadom
Včeraj, torej 4. oktobra, je Facebook doživel daljši izpad storitev, obnova je potekala postopoma, po šestih urah so bile vse storitve ponovno dostopne.
Poleg samega Facebooka so bili nedosegljivi tudi Instagram, FB Messenger, Whatsapp in OculusVR. Zanimivo, da je bila nedosegljiva tudi stran status.fb.com, ki naj bi sporočala status njihovih storitev in za katero bi si mislili, da bi jo gostili kje drugje. Razlog za izpad je bila napačna konfiguracija na usmerjevalnikih.
Na blogu so sicer že objavili nekaj več podrobnosti. Enostavno povedano je prišlo do napačne konfiguracije v protokolu BGP (Border Gatway Protocol). Gre za protokol, preko katerega si avtonomna omrežja v spletu med seboj posredujejo podatke, potrebne za vzpostavitev povezav. Če je internet le omrežje omrežij je BGP standard, ki jih med seboj povezuje. Facebook pa je preko tega protokola pomotoma nehal oglaševati povezave do njihovih DNS strežnikov.
- Spet večji izpad spletnih strani
- Za Amazanov izpad kriv programski hrošč in ena spremenjena nastavitev
Pri navadnem spletnem prometu bi od našega DNS strežnika v tem primeru dobili napako, ki bi nam jo prikazal spletni brskalnik. Dodatna težava pa so aplikacije na pametnih telefonih, ki v primeru take napake pogosto začno še bolj pogosto pošiljati DNS promet. Podjetje Cloudflare v odličnem zapisu na svojem blogu tako navaja, da so zabeležili 30x več DNS povpraševanj na svojih strežnikih, kar je dodatno poslabšalo situacijo.
Neuradno pa naj bi bila za dolgotrajnost izpada kriva tudi organizacija dela. Po pisanju nekoga, ki naj bi bil zaposlen kot administrator v Facebooku, naj bi za odpravo težav potrebovali tri skupine ljudi. Prvi imajo fizični dostop do podatkovnih centrov, drugi imajo prave poverilnice za prijavo v te sisteme in tretji, ki dejansko vedo, kako popraviti težave pri konfiguraciji. Zaradi omejenega dela, povezanega s koronavirusom, naj bi se vse skupaj še dodatno zavleklo.