Amazon美国东部EC2数据中心发生故障(原因是EBS容量不足),影响了多个依赖于EC2服务的网站。Amazon应该是最云计算的公司了,应用也最广泛,连老大都出事了,我们如何去使用和信任云计算和云服务呢?一旦云服务平台出现问题,是否要有本地的备份机制?一旦建立本地机制,那云的优势在哪?


AWS除了对EC2等核心服务提供了SLA并在不断完善,在客户层面,HA的提高还需要架构上的改进,有兴趣可以参考 http://aws.amazon.com/architecture/, AWS针对不同应用提供了多种架构建议。

安全问题来源于两方面,一个是外部的安全威胁,比如黑客攻击,自然灾害等;一个是内部的安全威胁,比如内部人员窃取资料,内部员工操作失误导致的数据丢失等。

你所说的安全隐患是外部的安全威胁导致部分Amazon的客户受到了影响。这个影响是掉线么?数据丢失么?如果说是掉线的话那么就算不用云也会存在掉线的问题,不是说出现了问题就不去追究,云服务也是在不断的解决问题中增强安全性和可靠性。云服务商掉线必然会是一个大新闻,而企业掉线则最多是通报批评。如果是数据丢失则可能性很小,云厂商比如UCloud会采取两地三中心的方案来确保客户数据的备份和不丢失。

我的结论是使用云服务优于自己搭建,理由如下:

1。 云服务比自己构建安全的平台要便宜。安全是一件繁杂、长期、需要投入专业的人才,可观的资金的事情。机房建设和管理、抗DDoS、渗透测试、流量清洗、异地备份、主机审计、资料库审计等等安全方面的工具和人力投入都需要花费大量资金。

2。云服务具备大量的被攻击经验和数据,别的企业被攻击的黑客信息,可以直接用来防止还未被攻击的企业遭到攻击。云服务提供商可以根据自己运营中发现的攻击信息进行分析,直接将黑客拉入黑名单,并对自身服务进行不断优化,这也是共享经济带来的其中一个便利。3。使用云服务的企业可以专注于自身业务的改进,而不用为底层设施出现的问题操碎了心。很多软体企业疲于应付层出不穷的攻击、宕机、网路故障等等事情,当人员、资金有限的时候选择应对基础设施的问题就必然会影响业务的优化和提升,并且如果是一家初创企业,在求生存的同时还要兼顾好安全的方方面面就很难做到了。

任何系统的可用率都不可能是100%, 亚马逊大部分服务的可用率至少达到了三个九, 这对一般的小型应用来说, 足够了.

不过相对于简单的服务不可用, 丢失数据的危害更大, 所以数据总是要自己做备份的, 或者选择多个云服务提供商, 不把鸡蛋放在一个篮子里
云是安全可靠的,不安全不可靠的是从地面到云之间的对流层.
现在,云服务越来越多,我们承认云服务是有很多好处,但云存储也同样存在著一些问题。下面是数据上云存储的几个主要坏处:
1.安全性与稳定性得不到保障
当企业实施数据上云之后,必然要将数据从原来的主存储系统迁移到新的云存储系统中,这个迁移的过程产生了极大的安全隐患,若操作不当可能导致企业数据丢失,目前来看华为云在安全上还是值得信赖的。
2.应用不当会导致成本居高不下

虽然公有云服务方便了中小企业日常的数据资源管理,减少其设备能耗开支,但也为其带来了数据存储安全、用户隐私、安全监管等安全问题,以及存储和迁移等成本问题。

3.兼容性差,操作性复杂
目前市场环境下,各大云厂商各自为政,云服务提供商水平参差不齐,市场竞争混乱。由于各服务商采用的云数据标准差别较大,这些都使数据兼容性差,很难从一个云服务商到另一个服务商之间的零成本转移。
总之,虽然数据上云给企业带来无与比拟的好处,但是云数据仍然是存在著许多问题的,我们不可避免,我们一定要深思熟虑。

安全可靠是相对的,没有绝对安全可靠的服务。

任何服务都不能保证100%的SLA,如果能够保证服务在99.9%的情况下都正常,那么这个意义就已经非常大了。我相信在这次事故后,Amazon的云服务品质会进一步得到提升。

InfoQ上关于这个事件的评论很有意思:

「但是,汽车交通事故不更多吗?」http://www.infoq.com/cn/news/2011/04/amazon-ec2-outage

补充:

InfoQ那篇文章中还提到:「另一个话题将是云提供商给出的SLA——Amazon EC2针对多AZ部署的外部连通性SLA是99.95%。EBS和RDS都还没有SLA。」可见 Amazon 对 EBS 和 SLA 的定位,还是属于正在不断完善中的服务。

这个问题很有趣,类比的问题是,数学计算都是对的吗?

云计算是个概念,为了实现这个概念,会包含很多的东西,包括架构设计,机房建设,运营支持等等等,很多方面.不同的公司,在实现的时候会有不同的实现方式.对于运营事故的响应和容灾能力也会有不同的要求.看起来,这次amazon是出了一次运营事故,不负责任的猜测应该是属于容灾方面的问题.这个问题,可能暴露了一些amazon的运营故障容灾方面的考虑不充分,但是绝不能因此否定云计算,就好像不能因为有次吃了臭鸡蛋拉肚子,就说鸡蛋吃不得.至于如何使用云计算平台,需要使用方充分评估自己的业务,并对计算平台提出一个要求,比如说,这次发生的故障的影响,是否可以接受,可以接受多长时间的故障?我想,是否可以相信云计算,更应该考虑的是,我们的服务需要在一个怎样的平台上运行,需要一个怎样的可靠性.而不是云计算本身是否需要本地备份机制的讨论.
没有绝对的安全,汽车比牛车快了,看似不安全了,但是人类还是要发展汽车。


真正的云主机安全性要比独立的物理伺服器好多了。


首先评价一个服务安全性好不好,最基本来说,要从3方面来看。

1. Integrity : 完整性

2.Availability :可用性

3.Confidentiality : 机密性

就云服务来说,完整性就是用户存储在云端的数据不能被篡改,所以云服务商对存储在伺服器上的数据要加密(因为多用户共享同一存储容器)。可用性就是说,用户在需要用到该服务时,云端要保证可以提供稳定的服务,这个就需要比较牛X的虚拟技术来保证了,还要屏蔽网路攻击(比如DDos)等等。机密性就是保证数据被有许可权的人看,公开该公开的,别啥都能被爬虫扒出来。

云服务呢,也才刚刚开始,提升完善还需要一定的时间,虽然现在Amazon一家独大,但IT界大佬们也都在努力迎头赶上。竞争才刚刚开始,我们就边吃瓜边比较吧。毕竟云是以后大大趋势。


不知道什么时候开始,网路通讯改叫云通讯了,在线教育改叫云教育了,虚拟伺服器租用改叫云主机了,信息安全改叫云安全了,何时才能云消雾散?何时才能回归本质

前两天看到一个类似的新闻,看到了很多人对于云可靠性的担忧:《用户对云计算服务可靠性的怀疑正在加剧》,大致意思是亚马逊云计算因域名系统错误的问题导致了短暂的宕机,导致几十家韩国公司都遭遇了网页和手机客户端不能访问的情况,并且亚马逊还未提及要为受影响的客户赔偿。这一事件的出现使不少业内人士开始担忧此事件将会激起用户对云计算服务的不信任,并为正在快速增长的韩国服务市场带来更多阴影。

云正在全球以很快的速度发展著,马云预测说,以后云计算就像日常用的水电天然气一样,变成一个日常生活基础的东西。毕竟云的出现是为了解决传统IT行业自己搭建机房的各种困境和成本问题,如果传统IT遇见的一系列问题没有比云化更好的解决办法的话,云就是未来IT发展的必然趋势。

其实云服务就像是一个大机房,企业自己搭建的小机房尚且会遇见断电、火灾、运维人员操作失误等一系列的危害风险,更何况是当一片集群在一起的时候,而比用户更担忧云出现问题的,是云厂商本身。

云厂商们为了保障业务的稳定和安全性,在保障上面出现的技术和方案是层出不穷,并且一直在进步。亚马逊第一次出现宕机事故的时候是零几年出现了雷电电击事故,整个机房宕机约48小时,后来在其长达十余年的发展史上,也出现了几次比较大的事故,宕机时间从48小时到20几个小时到几个小时到十分钟,从这个角度看,亚马逊一直是在进步的。

而亚马逊作为云行业的老大,也一直在被各大云厂商所瞻仰和学习,一旦亚马逊出了事故,就是全世界云厂商的警醒,我相信各大云厂商的技术人员们已经开始在分析亚马逊本次遇见的问题并且假定自己会遇见并在讨论解决方案了吧。

如果企业在上云的时候有担忧,可以考虑以下几点:

1、多多咨询和考核云厂商的AZ容灾技术和方案,现在很多云厂商为了防止影响业务,都会建立多个机房,在某个机房宕机的时候快速迁移到另一片集群。企业可以要求云厂商拿出容灾方案,评估云厂商的容灾效果。另外,对于数据安全,也多了解下云厂商的数据隔离、数据加密方面的措施;

2、了解一个云厂商对于安全事故的态度。绝大部分的云厂商都有规范化的事故处理方式,并且也会有事故保障书、SLA等,写清楚了事故出现以后根据事故等级给予客户的赔偿条件。要知道,厂商都敢这么明白的做保障了,那么比企业更担心的必定是云厂商里面各个工作人员,他们必定会兢兢业业的~

3、企业如果上云,可以先将一部分不重要的业务迁移到云上,观察使用情况,再将所有业务逐步上云。并且,针对重要的业务,可以采用公私混合的方式上云,不那么重要的大部分数据和业务放在公有云上,很核心的技术和业务放在私有云上,采用公私混用。另外题主说到的本地备份,也不需要所有数据都备份,在本地备份最重要最核心的。

最后,云除了本地备份等,在其他方面相对于传统IT行业也有他的优势,如:弹性扩容、部署更简单、升级更便捷等等。当然任何事物都有两面性,云确实也有他的缺点,答主仅站在中立态度分析和看待云,供各位小主参考,在选择上云的时候,还是要根据自身的业务需要和各种风险预判等方面去决定。


在计算机不能自我诊断自我恢复而需要 SA 半夜收简讯被赶起来排除问题之前一切云计算都是不可靠的。
推荐阅读:
相关文章