- 12:05 – doplněny informace z detailního popisu příčin výpadku od Superhiostingu
Řada webů hostovaných na službě Superhosting.cz bylo dnes odpoledne nedostupných. Provozovatele hostingu postihl výpadek páteřní sítě.
Resime problem s vypadkem paterni site. Delame vse pro obnoveni co nejrychleji. Dalsi update zde za 10 minut. Omlouvame se za komplikace.
— SuperHosting.cz (@superhosting) 30. Červenec 2015
Výpadek nastal kolem 15:30 a trval déle než hodinu a půl.
Superhosting v pátek na blogu zveřejnil detailní popis toho, co se stalo. Kromě problému na dvou routerech v datacentru TTC se podle něj na nedostupnosti služeb podílel i výpadek DNS serverů.
„V době výpadku byl jeden DNS server mimo postiženou část sítě, druhý byl offline v TTC. Bohužel chybou na naší straně v návrhu, kdy prefix 95.168.192.0/20 propagujeme pouze z dvojice páteřních routerů v TTC, jsme v daný moment měli oba BGP routry offline, nebyl agregovaný prefix DNS serverů vidět v internetu,“ uvádí firma.
První vysvětlení
První popis situace poskytl Lupě krátce po vyřešení výpadku zakladatel Superhostingu Zdeňěk Cendra. Podle něj mělo dojít k souběhu dvou problémů rychle po sobě:
„Odešel nám hardware v jednom routeru, a tak jsme přepli na zálohu. V té době vše fungovalo a navenek nebylo nic znát. Asi o půl hodiny později ale nastal stejný problém i na tom záložním routeru. V té chvíli jsme v DC TTC ztratili konektivitu a začali jsme to řešit,“ popsal Lupě příčiny výpadku.
„Nejdéle trvalo zjistit, v čem je příčina problému. Karta totiž fungovala, ale zahazovala 100 % packetů. Nešlo o situaci, kdy by vyhořela a začalo se z ní kouřit. Kartu jsme pak fyzicky vyměnili, chvíli trvalo upravit konfiguraci, a potom se nám povedlo router opět zprovoznit,“ pokračuje.
„Že nastane problém i na záložním routeru, je náhoda, která je nepravděpodobná – ale stala se. Sešly se dva problémy na dvou zařízeních ve dvou místnostech a bohužel přišly moc rychle po sobě,“ dodává.
O případných kompenzacích se firma podle něj bude s klienty domlouvat individuálně.
Výpadek jsme sledovali průběžně:
17:09 – Všechny servery jsou nyní online. „Primarni pricina: HW selhani 10G karty na primarnim routeru a o chvili pozdeji jine 10G karty na backup routeru,“ vysvětluje Superhosting na Twitteru.
17:01 – „90 % serveru nyni funguje, pracujeme na poslednich 10%,“ hlásí Superhosting.
16:38 - Problém je na naší straně, přiznává Superhosting. Firma na Facebooku napsala, že 10 % serverů je opět online a na zbytku se pracuje. „Pro vsechny je priroita zaridit zpet konektivitu k serverum – cela pricina je 100% na nasi strane → netyka se energie, samotne servery bezi, doslo k problemu na dvou sitovych zarizenich v nasi siti v TTC DC,“ doplňuje Superhosting.
16:11 – „Resime problem na dvou prvcich do DC TTC, delame vse pro co nejrychlejsi vyreseni, problem je 100% na IP vrstve na strane SH,“ napsal na svém Twitteru zakladatel Superhostingu Zdeněk Cendra.
Firma aktuální informace zveřejňuje na svém twitterovém účtu a facebookové stránce, aktualizace přidává každých zhruba deset minut.
Nedostupné byly například weby TV Nova, Slevomatu, Rohlik.cz, Skrz.cz, Bazos.cz, Mixit.cz, Tyinternety.cz a mnohé další.
Doteď jsme mysleli, že bude dnešek po včerejšku dalším rekordním v historii.. #superhosting a jeho výpadek dělá ale vše proti. @superhosting
— MIXIT.cz Müsli (@MIXITcz) 30. Červenec 2015