本杰明·富蘭克林曾經(jīng)說(shuō)過(guò),這個(gè)世界上有兩件事情不可避免,死亡和納稅。但如果這位偉大的政治家和發(fā)明家活在我們的現代世界,也許服務(wù)器停機也會(huì )進(jìn)入這個(gè)名單。
不管底層技術(shù)再怎么好,也不管托管提供商再多么能干,云總是會(huì )發(fā)生故障。
以下這個(gè)名單恐怕是這些公司不想看到的:CRN的2014年前10大云故障。
Dropbox,2014年1月10日
這家云存儲公司在在1月10日美國東部時(shí)間晚上8:30開(kāi)始出現全球宕機。
事后Dropbox表示,當時(shí)他們在對某些設備進(jìn)行操作系統更新操作,這個(gè)系統中保存了圖片集共享和相機上傳功能所使用的數據庫,但并非文件存儲的核心業(yè)務(wù)。升級腳本中的一個(gè)小錯誤導致操作系統在一臺動(dòng)態(tài)設備上重新安裝,導致系統失控。
Dropbox的網(wǎng)站返回服務(wù)器錯誤信息,臺式機和移動(dòng)設備無(wú)法進(jìn)行文件同步。
大多數服務(wù)器通過(guò)備份在3個(gè)小時(shí)內恢復,但是完整的核心服務(wù)用了兩天時(shí)間才完全恢復。
三星,4月21日
當天,韓國南部Gwacheo的一座數據中心起火,在接下來(lái)的幾個(gè)小時(shí)內,全球范圍的三星智能手機和平板電腦都無(wú)法獲取他們的數據。
第四層的起火還導致了信用卡服務(wù)、三星Smart TV和其他采用三星服務(wù)器的設備出現故障。
專(zhuān)家提出質(zhì)疑,為什么這么多的服務(wù)器被放置在了同一個(gè)地方,而沒(méi)有在其他地點(diǎn)提供系統冗余。
Internap,5月16日
在紐約地區的一次公共電力故障后,Internap位于紐約的一個(gè)不間斷供電系統停機了。停機發(fā)生在凌晨三點(diǎn),對使用托管和IP連接服務(wù)的客戶(hù)造成了影響。
在接下來(lái)的7個(gè)小時(shí)內,Internap一直處于停機狀態(tài)。
這次停機影響到流視頻平臺Livestream和StackExchange網(wǎng)絡(luò )站點(diǎn)。
微軟Lync,6月23日;微軟Exchange,6月24日
Lync是微軟的即時(shí)消息和VoIP服務(wù),也是微軟云業(yè)務(wù)產(chǎn)品Office 365套件的一部分,該服務(wù)于美國東部時(shí)間6月23日在北美洲大部分地區發(fā)生中斷。
微軟稱(chēng)這次中斷是由“外部網(wǎng)絡(luò )故障”所導致,部分用戶(hù)受影響長(cháng)達8個(gè)小時(shí)。
第二天,Lync繼續影響Office 365用戶(hù),微軟的托管電子郵件服務(wù)Exchange Online也遭遇相同的命運,部分客戶(hù)電子郵件服務(wù)中斷長(cháng)達9個(gè)小時(shí)。
微軟表示這次中斷與Office 365故障無(wú)關(guān)。
Verizon Wireless,6月27日
Verizon Wireles遭遇了一次廣泛的故障,導致其部分計費系統停機,使客戶(hù)無(wú)法訪(fǎng)問(wèn)他們的在線(xiàn)帳戶(hù)、支付賬單,在某些情況下無(wú)法升級手機。
系統范圍的停機從周五就開(kāi)始了,持續了大約一天時(shí)間,不僅對使用My Verizon 在線(xiàn)賬戶(hù)的客戶(hù)造成了影響,還影響到Verizon自己的零售商店客戶(hù)。
No-IP.com惡意中斷,6月30日
如果按規模經(jīng)濟生產(chǎn)力衡量的話(huà),這并不是一次嚴重的停機時(shí)間,但該事件比其他更令人氣憤,因為這是人為造成的停機。
No-IP.com是一家總部在美國內華達州里諾的免費動(dòng)態(tài)DNS服務(wù)提供商。微軟以打擊網(wǎng)絡(luò )犯罪為由接管了No-IP.com的23個(gè)網(wǎng)域,在此過(guò)程中,微軟還造成180萬(wàn)No-IP.com的合法客戶(hù)服務(wù)中斷超過(guò)2天。
這些客戶(hù)中包括SonicWall,一家被戴爾2012年收購的網(wǎng)絡(luò )安全廠(chǎng)商,該公司表示其數百家客戶(hù)掉線(xiàn),包括那些安裝了使用No-IP.com動(dòng)態(tài)DNS服務(wù)以中繼視頻輸入的安全監控攝像頭的建筑物。
聯(lián)邦法院將對于這些網(wǎng)域的DNS權交于微軟,后者稱(chēng)他們遭受了惡意軟件的攻擊。
微軟Azure,8月18日
Azure云在一次作為每月補丁日發(fā)布的Windows 8.01安全補丁之后導致部分用戶(hù)中斷服務(wù)長(cháng)達5個(gè)小時(shí),引發(fā)技術(shù)問(wèn)題。
微軟報告稱(chēng),Azure服務(wù)例如虛擬機網(wǎng)站、自動(dòng)化、備份和站點(diǎn)恢復都在多個(gè)地區出現中斷。
一些分析師抱怨軟件巨頭微軟事后并未對該事件進(jìn)行完整檢查。
微軟Azure,11月18日
正如Gartner知名分析師Lydia Leong在11月這次停機時(shí)間之后的抱怨稱(chēng),“微軟無(wú)法讓Azure服務(wù)中斷只局限于一個(gè)地區,這為很多考慮Azure的企業(yè)亮起了紅燈。”
11月18日的中斷事件影響到全球范圍內使用各種Azure服務(wù)的客戶(hù),而這主要是由云存儲服務(wù)一次性能升級中出現的小故障所導致。
微軟最終確定人為錯誤是罪魁禍首。
Amazon Web Services CloudFront DNS,11月26日
Amazon Web Services的CloudFront DNS服務(wù)器從美國東部時(shí)間下午7:15開(kāi)始持續了近2個(gè)小時(shí)。在下午9點(diǎn)之后DNS服務(wù)器開(kāi)始恢復備份。
部分網(wǎng)站和云服務(wù)發(fā)生掉線(xiàn),在這期間內容交付網(wǎng)絡(luò )無(wú)法完成DNS請求。沒(méi)有發(fā)生什么大事,但是值得列入該榜單,因為它涉及到全球最大的也是運行時(shí)間最長(cháng)的云。
Xen漏洞重啟:AWS、Rackspace、IBM SoftLayer,11月下旬
這不是某一次云故障,而是多個(gè)公有云[注]被迫進(jìn)行緊急重啟,這次發(fā)生在11月下旬的故障中斷了很多客戶(hù)的運營(yíng)。
Xen開(kāi)源管理程序中的一個(gè)安全漏洞導致了這次重啟。
AWS、Rackspace和SoftLayer都向客戶(hù)發(fā)出了警告——有些情況下僅數個(gè)小時(shí)——稱(chēng)將會(huì )出現暫時(shí)脫機的情況,然后他們需要重新啟動(dòng)他們的云服務(wù)。
所有云提供商完成補丁安裝之后向公眾發(fā)了一則咨詢(xún)建議。