To není pravda - amazon má aktuálně 5 "regionů" ale jak přesně je to s mapováním na datacentra není jasné. Amazon navíc ještě dále pracuje s "availability zones" v rámci regionů (v regionu US-EAST-1 kde došlo k výpadku jsou 4) a tam také není jasné jestli jsou všechny v jednom datacentru nebo ne. Je klidně možné že jsou fyzicky v jedné budově, ale nějak oddělené (vlastní generátory, síťová infrastruktura apod.)
Každopádně availability zones jsou kompromis - nižší ceny za přenosy, nižší latence apod. výměnou za umístění v relativní blízkosti. Pokud chcete skutečně geograficky nezávislé instace, tak nejlépe v různých regionech. Ale bude to dražší a pomalejší ...
Jaký si to uděláš, takový to máš ... ne pro každou firmu je cloud vhodným řešením, ne každý poskytovatel cloudových řešení je dobrý.
Navíc cloudem se dnes označuje kde co, je to aktuální buzzword bez jasné definice - každý si od toho slibuje něco jiného. Primárním cílem asi byla efektivní virtualizace, tj. schopnost transparentně sdílet hw prostředky. Možnost používání veřejných cloudů a geografického rozložení (což by si většina firem dovolit nemohla) je třešinka na dortu.
Jak se tedy Amazonu podařilo dosáhnout kompletního výpadku???
Jedna vec je "fyzicky" vypadek zpusobeny treba chybou HW nebo prerusenim napajeni - ten se obvykle tyka jen jednoho datoveho centra, pripadne jedne geograficke lokality (dejme tomu kolize Seattlu s meteoritem).
Jenze muze dojit i k "logickemu" vypadku, treba kdyz se Amazonu povede nezdarenym updatem zmrvit nejake ridici servery, nebo si rozbijou vnitrni routovani, nebo tak neco. To pak muze s trochou smuly zasahnout treba vsechna jejich datova centra najednou.
mimochodem ještě donedávna jsem si říkal, že možná někdy v dohledné době přejdu na Amazon, že je to spolehlivé řešení bez výpadků. A hle, stačí jeden den a měli delší výpadek než já na svých necloudových serverech za 5let.
Navíc mě štvalo že Amazon je potichu, nějaké omluvy, kompenzace ... nic jsem neslyšel. Zatím se mi tedy jako nejspolehlivější jeví Google cloud služby. Ale ty jsou na můj vkus až příliš složité na pochopení, nevěděl bych vůbec jak s nimi začít.
Nejvetsim problemem neni vypadek samotny, ale naprosta neschopnost Amazonu odpovedet uzivatelum na dotazy a komunikovat s nimi. Krasny blogpost na to napsal Roman Stanek: http://roman.stanek.org/2011/04/21/mr-jassy-tear-down-this-wall/
"Cloud" - všechno, co nemáte doma (nebo obecně ve vlastním držení, třeba ve firmě, na vlastních pobočkách apod). Nezáleží na tom, na kolika místech ve světě to je. Prostě to nemáte doma a nemáte nad tím kontrolu, jen se k tomu kamsi připojujete, přičemž "kam", je zcela irelevantní. Zkrátka takový outsourcing. A ten nezřídka stojí (často stál) zavyliž(_!_).
Bavím se o konceptu cloudu jako takovém. Jak konkrétně to má udělané Amazon jsem neřešil - že v tomto ohledu špatně je zjevné z toho, že k tomu výpadku vůbec došlo.
"Ostatne, kdyby servery v Irsku braly data z diskovych poli v Kalifornii, asi byste se rychlosti divil :-)"
No to bych se fakt divil. Konkrétně tomu, že ten cloud někdo implementoval až tak pitomě.