Amazon美國東部EC2數據中心發生故障(原因是EBS容量不足),影響了多個依賴於EC2服務的網站。Amazon應該是最雲計算的公司了,應用也最廣泛,連老大都出事了,我們如何去使用和信任雲計算和雲服務呢?一旦雲服務平台出現問題,是否要有本地的備份機制?一旦建立本地機制,那雲的優勢在哪?


AWS除了對EC2等核心服務提供了SLA並在不斷完善,在客戶層面,HA的提高還需要架構上的改進,有興趣可以參考 http://aws.amazon.com/architecture/, AWS針對不同應用提供了多種架構建議。

安全問題來源於兩方面,一個是外部的安全威脅,比如黑客攻擊,自然災害等;一個是內部的安全威脅,比如內部人員竊取資料,內部員工操作失誤導致的數據丟失等。

你所說的安全隱患是外部的安全威脅導致部分Amazon的客戶受到了影響。這個影響是掉線么?數據丟失么?如果說是掉線的話那麼就算不用雲也會存在掉線的問題,不是說出現了問題就不去追究,雲服務也是在不斷的解決問題中增強安全性和可靠性。雲服務商掉線必然會是一個大新聞,而企業掉線則最多是通報批評。如果是數據丟失則可能性很小,雲廠商比如UCloud會採取兩地三中心的方案來確保客戶數據的備份和不丟失。

我的結論是使用雲服務優於自己搭建,理由如下:

1。 雲服務比自己構建安全的平台要便宜。安全是一件繁雜、長期、需要投入專業的人才,可觀的資金的事情。機房建設和管理、抗DDoS、滲透測試、流量清洗、異地備份、主機審計、資料庫審計等等安全方面的工具和人力投入都需要花費大量資金。

2。雲服務具備大量的被攻擊經驗和數據,別的企業被攻擊的黑客信息,可以直接用來防止還未被攻擊的企業遭到攻擊。雲服務提供商可以根據自己運營中發現的攻擊信息進行分析,直接將黑客拉入黑名單,並對自身服務進行不斷優化,這也是共享經濟帶來的其中一個便利。3。使用雲服務的企業可以專註於自身業務的改進,而不用為底層設施出現的問題操碎了心。很多軟體企業疲於應付層出不窮的攻擊、宕機、網路故障等等事情,當人員、資金有限的時候選擇應對基礎設施的問題就必然會影響業務的優化和提升,並且如果是一家初創企業,在求生存的同時還要兼顧好安全的方方面面就很難做到了。

任何系統的可用率都不可能是100%, 亞馬遜大部分服務的可用率至少達到了三個九, 這對一般的小型應用來說, 足夠了.

不過相對於簡單的服務不可用, 丟失數據的危害更大, 所以數據總是要自己做備份的, 或者選擇多個雲服務提供商, 不把雞蛋放在一個籃子里
雲是安全可靠的,不安全不可靠的是從地面到雲之間的對流層.
現在,雲服務越來越多,我們承認雲服務是有很多好處,但云存儲也同樣存在著一些問題。下面是數據上雲存儲的幾個主要壞處:
1.安全性與穩定性得不到保障
當企業實施數據上雲之後,必然要將數據從原來的主存儲系統遷移到新的雲存儲系統中,這個遷移的過程產生了極大的安全隱患,若操作不當可能導致企業數據丟失,目前來看華為雲在安全上還是值得信賴的。
2.應用不當會導致成本居高不下

雖然公有雲服務方便了中小企業日常的數據資源管理,減少其設備能耗開支,但也為其帶來了數據存儲安全、用戶隱私、安全監管等安全問題,以及存儲和遷移等成本問題。

3.兼容性差,操作性複雜
目前市場環境下,各大雲廠商各自為政,雲服務提供商水平參差不齊,市場競爭混亂。由於各服務商採用的雲數據標準差別較大,這些都使數據兼容性差,很難從一個雲服務商到另一個服務商之間的零成本轉移。
總之,雖然數據上雲給企業帶來無與比擬的好處,但是雲數據仍然是存在著許多問題的,我們不可避免,我們一定要深思熟慮。

安全可靠是相對的,沒有絕對安全可靠的服務。

任何服務都不能保證100%的SLA,如果能夠保證服務在99.9%的情況下都正常,那麼這個意義就已經非常大了。我相信在這次事故後,Amazon的雲服務品質會進一步得到提升。

InfoQ上關於這個事件的評論很有意思:

「但是,汽車交通事故不更多嗎?」http://www.infoq.com/cn/news/2011/04/amazon-ec2-outage

補充:

InfoQ那篇文章中還提到:「另一個話題將是雲提供商給出的SLA——Amazon EC2針對多AZ部署的外部連通性SLA是99.95%。EBS和RDS都還沒有SLA。」可見 Amazon 對 EBS 和 SLA 的定位,還是屬於正在不斷完善中的服務。

這個問題很有趣,類比的問題是,數學計算都是對的嗎?

雲計算是個概念,為了實現這個概念,會包含很多的東西,包括架構設計,機房建設,運營支持等等等,很多方面.不同的公司,在實現的時候會有不同的實現方式.對於運營事故的響應和容災能力也會有不同的要求.看起來,這次amazon是出了一次運營事故,不負責任的猜測應該是屬於容災方面的問題.這個問題,可能暴露了一些amazon的運營故障容災方面的考慮不充分,但是絕不能因此否定雲計算,就好像不能因為有次吃了臭雞蛋拉肚子,就說雞蛋吃不得.至於如何使用雲計算平台,需要使用方充分評估自己的業務,並對計算平台提出一個要求,比如說,這次發生的故障的影響,是否可以接受,可以接受多長時間的故障?我想,是否可以相信雲計算,更應該考慮的是,我們的服務需要在一個怎樣的平台上運行,需要一個怎樣的可靠性.而不是雲計算本身是否需要本地備份機制的討論.
沒有絕對的安全,汽車比牛車快了,看似不安全了,但是人類還是要發展汽車。


真正的雲主機安全性要比獨立的物理伺服器好多了。


首先評價一個服務安全性好不好,最基本來說,要從3方面來看。

1. Integrity : 完整性

2.Availability :可用性

3.Confidentiality : 機密性

就雲服務來說,完整性就是用戶存儲在雲端的數據不能被篡改,所以雲服務商對存儲在伺服器上的數據要加密(因為多用戶共享同一存儲容器)。可用性就是說,用戶在需要用到該服務時,雲端要保證可以提供穩定的服務,這個就需要比較牛X的虛擬技術來保證了,還要屏蔽網路攻擊(比如DDos)等等。機密性就是保證數據被有許可權的人看,公開該公開的,別啥都能被爬蟲扒出來。

雲服務呢,也才剛剛開始,提升完善還需要一定的時間,雖然現在Amazon一家獨大,但IT界大佬們也都在努力迎頭趕上。競爭才剛剛開始,我們就邊吃瓜邊比較吧。畢竟雲是以後大大趨勢。


不知道什麼時候開始,網路通訊改叫雲通訊了,在線教育改叫雲教育了,虛擬伺服器租用改叫雲主機了,信息安全改叫雲安全了,何時才能雲消霧散?何時才能回歸本質

前兩天看到一個類似的新聞,看到了很多人對於雲可靠性的擔憂:《用戶對雲計算服務可靠性的懷疑正在加劇》,大致意思是亞馬遜雲計算因域名系統錯誤的問題導致了短暫的宕機,導致幾十家韓國公司都遭遇了網頁和手機客戶端不能訪問的情況,並且亞馬遜還未提及要為受影響的客戶賠償。這一事件的出現使不少業內人士開始擔憂此事件將會激起用戶對雲計算服務的不信任,並為正在快速增長的韓國服務市場帶來更多陰影。

雲正在全球以很快的速度發展著,馬雲預測說,以後雲計算就像日常用的水電天然氣一樣,變成一個日常生活基礎的東西。畢竟雲的出現是為了解決傳統IT行業自己搭建機房的各種困境和成本問題,如果傳統IT遇見的一系列問題沒有比雲化更好的解決辦法的話,雲就是未來IT發展的必然趨勢。

其實雲服務就像是一個大機房,企業自己搭建的小機房尚且會遇見斷電、火災、運維人員操作失誤等一系列的危害風險,更何況是當一片集群在一起的時候,而比用戶更擔憂雲出現問題的,是雲廠商本身。

雲廠商們為了保障業務的穩定和安全性,在保障上面出現的技術和方案是層出不窮,並且一直在進步。亞馬遜第一次出現宕機事故的時候是零幾年出現了雷電電擊事故,整個機房宕機約48小時,後來在其長達十餘年的發展史上,也出現了幾次比較大的事故,宕機時間從48小時到20幾個小時到幾個小時到十分鐘,從這個角度看,亞馬遜一直是在進步的。

而亞馬遜作為雲行業的老大,也一直在被各大雲廠商所瞻仰和學習,一旦亞馬遜出了事故,就是全世界雲廠商的警醒,我相信各大雲廠商的技術人員們已經開始在分析亞馬遜本次遇見的問題並且假定自己會遇見並在討論解決方案了吧。

如果企業在上雲的時候有擔憂,可以考慮以下幾點:

1、多多諮詢和考核雲廠商的AZ容災技術和方案,現在很多雲廠商為了防止影響業務,都會建立多個機房,在某個機房宕機的時候快速遷移到另一片集群。企業可以要求雲廠商拿出容災方案,評估雲廠商的容災效果。另外,對於數據安全,也多了解下雲廠商的數據隔離、數據加密方面的措施;

2、了解一個雲廠商對於安全事故的態度。絕大部分的雲廠商都有規範化的事故處理方式,並且也會有事故保障書、SLA等,寫清楚了事故出現以後根據事故等級給予客戶的賠償條件。要知道,廠商都敢這麼明白的做保障了,那麼比企業更擔心的必定是雲廠商裡面各個工作人員,他們必定會兢兢業業的~

3、企業如果上雲,可以先將一部分不重要的業務遷移到雲上,觀察使用情況,再將所有業務逐步上雲。並且,針對重要的業務,可以採用公私混合的方式上雲,不那麼重要的大部分數據和業務放在公有雲上,很核心的技術和業務放在私有雲上,採用公私混用。另外題主說到的本地備份,也不需要所有數據都備份,在本地備份最重要最核心的。

最後,雲除了本地備份等,在其他方面相對於傳統IT行業也有他的優勢,如:彈性擴容、部署更簡單、升級更便捷等等。當然任何事物都有兩面性,雲確實也有他的缺點,答主僅站在中立態度分析和看待雲,供各位小主參考,在選擇上雲的時候,還是要根據自身的業務需要和各種風險預判等方面去決定。


在計算機不能自我診斷自我恢復而需要 SA 半夜收簡訊被趕起來排除問題之前一切雲計算都是不可靠的。
推薦閱讀:
相关文章