企業客戶越來越意識到,雖然公有云供應商并非完美,但對于IT基礎架構也沒有其它替代方案。因此,經歷宕機事件之后,相對于重新評估是否擁抱公有云模式,企業往往更有興趣了解宕機的根本原因,并認為無論出現什么問題,都會得到適當修復。
無論宕機是影響到企業工作負載或是熱門消費者應用,用戶更愿意看到供應商實現透明性并承擔責任,而實時響應與事后分析活動往往是檢驗客戶得失的差別所在。
供應商越大,它們的報告和修復標準就越高。無論是技術故障,人為錯誤或惡意攻擊造成的,客戶都希望對所建立的修復措施進行真實評估和解釋,以確保不會再發生同樣的情況。
1月26日,IBM
今年年初,IBM云的信用度受到影響,客戶用于訪問其Bluemix云基礎架構(以前稱為SoftLayer)的一個管理網站服務中斷了數小時。
雖然底層基礎架構沒有真的出現故障,但用戶發現他們無法管理自身的應用程序,添加或刪除支持工作負載的云資源。IBM表示該問題是由于一次接口升級造成,只是間歇性的。
1月31日,GitLab
一些客戶的生產數據最終丟失,包括對項目,評論與帳戶的修改。
該公司在事件后表示:“我們最合理的估計是此次影響了約5000個項目,5000個評論和700個新用戶帳戶?!?/span>
GitLab CEO在向用戶道歉時稱,“丟失生產數據是讓人無法接受的”。
2月9日,Instapaper
亞馬遜RDS服務上的MySQL數據庫文件大小限制引發了Pinterest服務器的長時間宕機。
之后,這家社交化書簽網站稱,其工程師從來不知曉在2014年4月之前創建的數據庫RDS容量限制為2TB,并且AWS服務也沒有發出表內存儲其“書簽”即將超過該限制容量的警告信息。
2月24日,Facebook
世界各地的一些用戶Facebook賬戶被鎖定了近三個小時,這讓他們擔心自己的帳戶被劫持了。
Facebook給出的解釋是為了預防黑客錯將用戶發送到恢復界面,讓人覺得其他人登錄了他們的帳戶。而受影響的用戶被阻止立即重新登錄。
2月28日, AWS
這次宕機事件極為轟動,相信大家對此記憶尤深。當時是一位AWS工程師試圖調試亞馬遜的弗吉尼亞數據中心S3存儲系統,但輸入了一個錯誤指令,導致許多互聯網——包括諸如Slack,Quora和Trello等眾多企業平臺宕機4個小時。
亞馬遜在事件后分析表示,該員工當時當時打算將一小部分用于計費過程的托管子系統服務器刪除。然而,錯誤命令導致了更多的服務器脫機,包括為數據存儲功能提供特定請求所需的一個子系統和另一個分配新存儲空間的子系統。
亞馬遜坐擁約三分之一的全球云市場,因此這次宕機事件重新引發了關于公有云的風險論。
3月16日,Microsoft Azure
微軟Azure公有云出現超過8小時的存儲可用性問題,主要影響到美國東部的客戶。有些用戶無法配置新的存儲空間或訪問本地現有資源。之后,一個微軟工程團隊確認原因為斷電導致的存儲集群不可用。
除此之外,微軟還在Azure狀態頁上列出了一個軟件錯誤,該錯誤影響跨多個服務的存儲配置超過一個小時。
3月21日,Microsoft Office 365
5月22日,在IBM云上的Lululemon
熱門瑜伽網站Lululemon出現服務中斷問題,其首席執行官將主要責任歸咎于IBM的托管云服務。
Lululemon首席執行官,Laurent Potdevin在接受CNBC(美國全國廣播公司財經頻道)采訪時直接指責在IBM云環境下電子商務銷售額遭受了損失。并表示他的團隊由于這個問題連續工作了36個小時,并已經向IBM CEO,Ginni Rometty表達了不滿。
Potdevin在談及對IBM云計算時稱,“我們正在考慮我們的選擇”。
6月19日,Microsoft Skype
主要分布在歐洲的微軟Skype用戶由于遭受明顯的分布式阻斷服務攻擊,接連出現宕機問題。
6月19日,Skype用戶開始抱怨多個小時的宕機問題。這次宕機持續到次日,用戶在通信平臺上無法連接,交流信息受阻。
雖然微軟沒有立即確認DDoS攻擊的報道,但一個名為CyberTeam的黑客組織在推特上承認該事件是他們所為。
6月28日, 蘋果iCloud
IDCsped 提供最新的IT互聯網資訊,本著分享、傳播的宗旨,我們希望能幫助更多人了解需要的信息!
部分文章轉載自互聯網、部分是IDCsped原創文章,如果轉載,請注明出處:www.aadmxx.cn !