Maily jsme poslat nemohli, protože byl zasažen náš mail server.
Tohle mi úplně stačí jako informace o tom, jak se v té firmě přemýšlí o záložních řešeních. Vždyť e-mail byl postaven na stejném principu jako cloud sto let před cloudem a dříve bývalo samozřejmostí mít minimálně jeden záložní mail server. U ISP by mne nenapadlo, že bude mít míň než tři mail servery.
Počet zákazníků se dá myslím odhadnout z toho, že obchodníci měli čas je po jednom obvolávat.
Nepatřím k lidem, kteří když uvidí "100 %", zatmí se jim před očima, a pak si stěžují v diskusi. Ale tenhle rozhovor mne rozhodně nepřesvědčil, že by u Casablanca INT bylo vše v pořádku.
Ehm ... pokud nekde provozuju neco vic nez domaci hernu, tak davam kontakt na minimalne 3 ruzne domeny ... co se mailu tyce, prave proto, ze mail jaksi neni zarucena sluzba.
Vubec nemluve o tom, ze stejne dobre jako mail se da hromadne rozeslat sms.
Jinak ve me cely rozhovor naprosto jednoznecne budi dojem, ze dotycny pan je nejen lhar (to jsou vsichni) ale i poradny podvodnik.
Ostře? Pokud někdo dělá ze mě blbce, tak se také nepárám.
Fakt nevím, co bych já odpověděl na to, že rack svítí jak vánoční stromek a přesto má být vypnutý, když nastala situace, že z elektrikářského hlediska se za těchto okolností jedná o zvlášť nebezpečné prostředí a za nás platilo, že kromě ochranných pomůcek na sobě je povoleno svítit max.12V=.
Pokud mi tam už někde něco zateklo v jiné lokalitě, tak se jako údržba elektroniky zajímám jak to vzniklo a jestli to nehrozí i jinde v mém rajonu, protože jako obyvatel paneláku vím, co voda dokáže vytopit i na zcela nelogických místech od zdroje poruchy.
Dále mám nejen v serverovně, ale i u mašin s elektronikou vedle hasičáků složené igelity co jsem vysomroval od kluků balící koberce, s obsluhami vyzkoušené v klidu za sucha, že vše půjde bezpečně zakrýt. Nejen voda, ale také prach třeba, když by se vyskytli sádrokartonáři, zedníci.....
Mno jo, pojišťovák pochvalně mručel nad tímto opatřením a promítl to do výše platby pojištění. Nic to nestojí (půlčák myslivca kobercářům), chleba to nežere, každý zaměstnanec, včetně ochranky ví co s tím má dělat, a hlavně pak budu mít míň práce s nápravou škody.
Nevim jak to delaj "profici" ... , ja to mam tak, ze pro rack jsou 2 UPS, a kazda napaji jednu vetev (= kazdy stroj ma dva zdroje a kazdy je napojen do jedne z nich). Samo i jedna z nich staci na korektni vypnuti/udrzeni do najezdu agregatu. Takze me ani mrtva upska nerozhazi.
A spomoci shazovani jisticu sem si testoval, ze to funguje jak ma.
Ale asi sem holt jen blbej amater, kterej nevi jak zajistit provoz serveru.
Není to poprvé, co mlžili, taky jsem tam několik let zpátky měl server, a došlo k výpadku, protože tam někdo udělal chybu. To se může stát, chyby děláme všichni, ale kdyby aspoň řekli pravdu, tu jsem se dozvěděl až po několika hodinách nefunkčnosti spojení, kdy jsme je bombardovali, že náš server je nedostupný.
Jako bombónek poslali "omluvný dopis", který vyzněl tak, že se vlastně nic nestalo, no přesně jak v tomto rozhovoru. O kompenzaci se tehdy nikdo ani nezmínil.
Myslím, že mlžit je jejich firemní politika. Proto už bych u nich žádné služby nezřizoval a jsem rád, že jsem svůj server nemusel vypínat šlapajíc ve vodě. Doufám, že tam aspoň rozdávali gumáky a gumové rukavice! :-)
Telefonni kontakty si nosim v telefonu :) Mailove kontakty byvaji zpravidla jinde. Take bych nezapominal na to, ze obchodnik nebyva clovek zdatny v technice, je rad ze mu neco funguje, ale rozhodne nezacne improvizovat s tim, jak odeslat mail jinak, kdyz se to posere :-) A v momente, kdy budou technici resit rozbehani mailu pro obchodnika asi nebudou tolik casu venovat obnove sluzby pro zakazniky. Nekdy ta logika je tak prosta...
Mně zase teda přijde v případě důležité zprávy mnohem lepší volat, protože mail může skončit ve spamu/v záplavě dalších mailů ho příjemce přehlédne/je někde mimo a maily si přečte až za několik dní. Než poslat někomu mail a tím považovat situaci za vyřešenou je jistější zatelefonovat a po telefonu klidně sdělit, že víc informací pošlu vzápětí v mailu.
Vedle toho e-mailu se taky dá dát na web, na Twitter, na Facebook a tiskovou zprávou informace, že došlo k havárii, vlastní e-mailový server není dostupný a jako nouzové řešení pro e-mailové informování se používá tato adresa. Řekl bych, že v krizové situaci se mají využít všechny dostupné komunikační kanály, ne zvolit jeden pomalý a nepřesný. Mne bylo vždy možné snáze kontaktovat e-mailem, a pořízení mobilního telefonu na tom nic nezměnilo – a nepředpokládám, že bych byl jediný.
Já mám v telefonu všechny kontakty… Rozběhání e-mailu pro komunikaci s klienty bych viděl jako úkol č. 3 hned po vypnutí vody a zabránění jejímu vniknutí do zařízení, kam se ještě nedostala. Není moc rozumné obnovovat nejprve službu pro zákazníka, a teprve pak zprovozňovat e-mail, kde jsou od toho zákazníka pokyny, jak službu obnovit (typu použijte zálohu z XY, která je konzistentní; nebo před nastartováním serveru nás informujte, abychom mohli ihned po startu odstavit web a nejprve provést vlastní kontrolu apod.).
Jinak právě proto, aby nemusel improvizovat obchodník a aby technici mohli řešit „důležitější“ věci, se takové věci jako e-mail provozují způsobem, že po výpadku jednoho uzlu jej automaticky zastoupí jiný. Řešit tohle až v okamžiku, kdy na server kape voda, je opravdu pozdě.
Jo vtipné.
Méně jsme se smál v Londýně, kde jsem spoléhal na TESCO supermarketu na obří nápis OPEN 24 HOURS. U nás to přece taky funguje.
Ovšem když jsem v neděli odpoledne přišel blíž... tak http://goo.gl/maps/kHmkf
Riziko... :-) Ano, konvice je rizikem v kazde kancelari, kde je vysoka koncentrace nabytku, papiru a dalsich dobre horlavych latek. Rekl bych, ze kazdy prumerny helpdesk... ;-)
Plyn resi pozar vznikajici v technologickem prostoru a reaguje jiz v momentu zarodku pozaru. Ale rozhodne nevyresi uhaseni v momente, kdy ty priciny vzniknou vne technologicke prostory, kde pozar jiz naplno zuri. Ty bomby maji taky omezenou kapacitu.
Pokud byla zákazníků desítka, byla to otázka jedné DESÍTKY minut. Prostě přecenili schopnost to ututlat nebo co hůř vzali těch pár zákazníků co jim to vyplavilo servery jako rukojmí snahy ukrýt problém BBO.
Pořád trvám na tom, že záměrné lhaní zákazníkům kteří byli bezprostředně spojeni s touto událostí tj všichni v HC8 by měl být základ jákéhokoliv akceschopného řešení. Navíc z toho vyšli jejich vlastní zákazníci časově mnohem lépe než samotná Casablanca a to měli mnohem těžší startovní pozici -> informaci nedostali vůbec nebo pozdě, mě ujistil opakovaně člověk na helpline že žádný problém neexistuje a zítra se ozve obchodník (paradoxně kvůli problému kterej neexistuje).
Na tom Seznamu treba nemate seznam tech kontaktu :-) Pochopitelne treba soukromy kontakt nekteri lide mezi sebou maji, protoze se proste znaji i jinak...
Apropo, jak byste se tvaril na podobny email informujici o incidentu v ramci obchodniho vztahu doruceny ze schranky, kterou neznate? Kdyz vam ted poslu mail z casablanca.helpdesk@gmail.com, tak budete duverovat tomu, ze jde o informaci z dane firmy? :-)
V kriticky moment nefungoval ani ten web. Socialni site nepouzivaji zdaleka vsichni - a uz vubec ne v onom kritickem momente, kdy sami maji problem - to maji fakt jine starosti, nez zkoumat obsah Facebooku (nehlede na to, ze treba o "selektovani" obsahu zprav ze skupin ze strany Facebooku i zde na Lupe par clanku bylo, ze ta informace dojde ke vsem skutecne neni zaruceno)...
V kolika podobnych kritickych situacich jste se ocitl sam? Ono to z tepleho kresla z domova vypada skutecne jinak, nez z bojiste primo na miste v dany okamzik. Samozrejme po bitve vzdycky kazdy umi rict, co slo udelat lepe ;-)
Mám za to že ma poměrně novou budovu, takže ty trubky nemusí být 50 let staré jako ve vedlejších cinzacich.
Porucha vznikla únavou materiálu vzniká postupně a ne že vám plným proudem teče voda z trubky.
Jsou to koncové rozvody kde může být tak maximálně 6 baru, ve výškové budově spíš méně.
Že jsou instalateri jedním že zaměstnání kde je nejvíc hovad to je také známo.Na odpad/vodovodní trubky nepotřebujete žádnou kvalifikaci jako třeba u plynaru nebo elektrikaru.
Být zaměstnancem tak také nepočítám že to bude nezaslepene. Ne vždy může mít možnost u velkých armatur ověřit na vodomeru průtok vody. Ten průměr je tak velký že po natlakovani už neslysite průtok z male trubky někde vedle.
Tahle věta nijak neodůvodňuje, proč by ISP měl mít jediný mail server.
Navíc mít e-mail pro nějakou službu, doménu nebo server na té samé službě, doméně nebo serveru není zrovna šťastné řešení – a spousta zákazníků se tomu třeba vyhla. Ti by maily pochopitelně dostali. Předpokládám, že drtivá většina z nich by e-mailovou komunikaci upřednostnila. Protože řešit takové věci jako obnovu ze záloh jenom tak, že něco řeknu do telefonu, a budu doufat, že to ten druhý správně slyšel, že na to nezapomene, že se to při dalším předávání nezkomolí – to bych fakt nechtěl.
Proč honba za senzacemi? Pokud mi nefunguje GMail, začnu zjišťovat, zda je problém jen u mne, nebo zda ten problém mají i ostatní. A je pohodlné podívat se na titulky Lupy a zjistit, že to opravdu dál řešit nemusím. Pravda je, že k tomuhle by úplně stačil Twitter účet, ale pokud k tomu mají víc než jednu větu, proč to nevydat jako aktualitu?
Podílem klientů jsem se vůbec nezabýval, pokud někdo vidí v reklamě „100 %“ a už ho nezajímá ani co je v té reklamě napsáno před tím a po tom, je to jeho problém. Také jsem nepsal o dokonalém řešení – na trhu je samozřejmě místo i pro nedokonalá levná řešení. Jenom ten e-mail nepovažuju zrovna u ISP za drobnost, která se v krizové situaci může snadno obětovat.
Rozhovor je veden ostře? Když pan několikrát záměrně lze? Sorry, ale jestli krizovy plán nepočítal s havárii vody, jestli firma komunikuje tak jak se tyden psalo v médiích. Tedy nijak a tento pan tvrdí opak... Copak ani nyní nepochopili v Casablance, ze ta nekomuniace byla megaprusvih?
Apropos ... v reakci na nadpis ... napadlo pana ze nekdo muze prekopnout elektrickou pripojku? Asi taky ne, pocitam ze az se stane, zjisti se, ze agregat stoji nekde na dvore ... na druhe strane prahy, protoze ho jaksi nikdo nestih privest a pripojit.
A predpokladam, ze uplne stejne by to dopadlo s konektivitou (bych tak nejak cekal minimalne dve oddelene trasy optiky + jeste nejakou tu uber nouzovku na strese).
Mailserver prece neni jen SMTP. Ano, je dlouhodobym zvykem provozovat vice SMTP serveru a tedy mit vicero MX zaznamu v DNS. I kdyz toto se take ne vzdy dodrzuje z jinych duvodu - zejmena kvuli spamu a ma to svou logiku. Ale ty zalozni SMTP byvaly vesmes o tom, ze v pripade nefunkcnosti primarniho SMTP to prijal ten zalozni a cekal, az ten primar zase nabehne. Jedna vec je samotny mail transfer... ale je li rec o skutecne mail delivery, pak je to cele ponekud slozitejsi :)
K té zmatené komunikaci ohledně poruchy směrovačů nám ten zMr. zapoměl říct, ře na hotline mají nařízeno vždy svádět výpadek nejprve na konektivitu (u ní slibují pouze 99.95%) a až teprve potom přiznat barvu.
Jsou to prolhaný hajzlové. Známému tvrdili, že BigBlueOne je geograficky rozdělený cloud a že výpadek jednoho datatcentra nebude mít vliv.
1) Jestli potrubí někdo přeřízne, nebo praskne, je jedno - protože výsledek může být stejný. Prasklé potrubí by možná neunikalo takovým tempem, ale s trochou smůly by klidně mohlo.
Otázka: Proč tam takový systém (střecha) nebyl instalován už dříve?
Odověď: Rozvody pro naše technologie jsme dělali sami a jejich zabezpečení je na dobré úrovni.
Kdyby řekl, že vzhledem k (jimi chybně odhadované) pravděpodobnosti nehody podobného rozsahu se jim taková investice zdála jako zbytečná, tak bych neřekl ani popel, ale takto? Hned další otázka měla být: Kolik takové opatření bude zhruba stát, abychom si ho mohli dát do poměru s vzniklými škodami...
2) Mail: Tohle prostě musí mít pořešené lépe, klidně i u konkurence. Protože kdy "opravdu" potřebuje taková firma hodně komunikovat? No právě když se něco hodně pokazí.
3) Obnova: "Tyto lokality jsou propojeny rychlostí 2 x 8Gbps pro aplikaci Disaster Recovery." Přenést 100 TiB rychlostí 16 Gbps mi vychází maximálně na dvacet hodin. Ale i kdyby to bylo 24 h, rozhodně to nejsou 3-4 dny. Chápu, že přenést není to samé co obnovit, ale v tom je právě ten celý problém: Informace na stránkách firmy jsou strašně nedostatečné, prošel jsem si celý web BBO a skutečně relevantních informací je tam pomálu.
4) Co jsme se nedozvěděli: Jestli jsem to dobře pochopil, tak BBO se skládá z balde serverů, které obsluhují data v HP 3PAR storage. Opravdu musely být obě části uloženy v jedné místnosti? Při množství prostor, které tam mají, by jistě šlo obojí oddělit tak, aby se dala podobná nehoda téměř eliminovat. Nevím, zda je to ale technicky možné a z článku jsem se to bohužel nedozvěděl. V takovém případě by totiž buď obnovovali počítače anebo data, což by jistě vedlo minimálně k jednodenní úspoře v případě disaster recovery. Také jsme se nedozvěděli, na jaké technologii běží ta záložní geograficky oddělená storage. Logicky mi vyplývá, že to nebude něco tak drahého jako primární 3PAR řešení.
Laicky se mi nabízí varianta: Do jedné místnosti servery, do další primární data storage a do další zálohovací systém podobný tomu vzdálenému. Klidně by pak stačilo každou lichou hodinu zálohovat do jiné lokality a každiu sudou v rámci budovy. Obnova z místně uložené zálohy by byla logicky rychlejší a pro spoustu zákazníků by jistě byla přijatelnější 2 h ztráta dat před 2 denním čekáním na obnovu. Jestli ale limitem rychlosti není samotné připojení do vzdálené serverovny, ale spíš technologie na některé ze stran, tak je to opravdu skandální.
Ostře? Mně připadá, že se naopak na spoustu zjevných rozporů ani nedostalo. Třeba pokud už byl problém s vodou ze zrezlých stoupaček, neměla by být uřízlá trubka zas takovým překvapením – únava materiálu mohla skončit úplně stejně. Pak je samozřejmě na místě otázka, zda v takovém případě je záloha v jiné lokalitě s dobou obnovy v řádu dní dostatečným řešením pro službu, která je prezentovaná tak jak je prezentovaná. Podobně ty údajné telefonáty od obchodníků jako jediný komunikační kanál.
Tak pro odeslání e-mailu stačí i jen SMTP klient, když to budeme takhle rozebírat. A i ten příjem e-mailů se dá řešit tak, že se budou ukládat do nového úložiště, takže nedostupný bude archiv, ale k novým e-mailům se dostanu (pak je samozřejmě zase složitější to spojit). V zoufalé situaci se to dá řešit i tak, že se založí nouzová schránka třeba na GMailu. Nedostupnost primárního úložiště by mohla znamenat nedostupnost kontaktů (pokud by byl adresář integrován s e-maily), ale telefonní kontakty k dispozici měli, takže e-mailové adresy předpokládám taky. Stejně bych u takovéhoto ISP očekával, že e-mailovou komunikaci dokáže obnovit v řádu desítek minut, ne hodin nebo dní.
Ono to vypadá, že si opravdu mysleli, že k výpadku BBO dojde jedině zásahem meteoritu nebo výbuchem sopky, a že v takovém případě obnova v řádu dní nebude nikomu vadit, protože nějaký internet bude to poslední, co tady budou lidé řešit. Což nejde moc dohromady s informací, že vodu v jiných sálech už měli.
V USA je to asi trochu něco jiného, tam když se na něčem domluvíte po telefonu, nebudou vám to později zatloukat. Myslím, že Verizon bude důvěryhodný podobně jako tři čeští mobilní operátoři nebo banky. Nevybíráte si je proto, že byste důvěřoval jejich procesům, ale proto, že jsou velcí – a podivné chování k zákazníkům překousnete.