在单云就能满足要求的情况下盲目追求多云有点像是“何不食肉糜”了。毕竟IT选型第一目标是:适用。
近日,某云厂商故障问题引起业内关注。有人提出,企业是否要选择其他方式来避免云故障损失,其中多云部署被多次提出。但同时不少人持反对意见,认为从性价比、技术实力等考虑多云并不现实。有意思的是,几乎无人质疑云计算比自建数据中心更为安全稳定。
首先需要确认一点:在全球范围内主流云厂商的故障时有发生。例如亚马逊AWS在2017年2月,就曾因一条错误指令引起宕机,影响了包括Slack、Quora和Trello在内的很多企业平台,停机4小时。去年9月,微软Azure数据中心还意外遭雷劈发生故障。
有网友评论,凡是IT都有故障概率,相对于传统IT单机,云计算已经通过大规模调度降低了故障率,大多数云厂商都声明可用性在99.9%-99.999%之间,且多数在故障后恢复很快。
知名市场研究机构Gartner旗下的CloudHarmony网站通过对48家云服务商故障发生的次数和市场监测表明,主流云厂商整体宕机时间在大幅缩短,意味着云厂商技术更加成熟,整体服务稳定性在逐年提高。
其次,多部署几个云就可以避免云故障带来的损失?亚马逊AWS首席执行官Andy
Jassy三年前就曾公开表示,使用多个云服务商的做法性价比不高。他认为,如果企业想走多云之路,最基本的要实现最底层的标准化,但是现在的云平台大都不同。其次,要维持多个堆栈的运行,不仅对资源要求高,而且昂贵,这对很多人来讲都是件伤脑筋的事。
Electric Cloud 公司的首席技术官兼联合创始人Anders
Wallgren也认为,企业在尝试使用多云战略之前,一定要确保自己真正了解云计算。举个例子,企业团队可能具备使用多个 SaaS
应用程序的能力——但并不表示企业就能在多个平台上管理多个 IaaS 环境。
而修理成本、日常管理和维护成本等也是IT决策者们要清醒认识的问题,如果只是奔着避免云故障的目标,最后可能发现要付出巨大的成本。
因此,对多云持犹豫态度的专家提出了一个更为现实的选项:相比用多云来解决稳定问题,更务实的做法是充分利用现有云服务商的最佳实践,优化自身系统的可用性。
云厂商基本已提供完善的容灾架构设计,包括冷备、热备、同城双活、异地多活等策略,可以针对系统可用级别与成本、效率综合考虑。对于不太重要的业务可以基于冷备或者热备的方案;对于比较重要的业务至少具备同城双活的能力;对于非常重要的核心业务需要考虑异地多活。且基础云产品基本都做到了跨可用区容灾,整体可用性成本很低。
举例来说,如果做了同城容灾,西南1的C机房故障,至少西南
1还有A、B等其他机房做备份。如果做了两地容灾策略,西南1故障,还有华南1、华东2可以用。基本上对于当前99%以上的企业而言,已经足以满足其可靠性要求。
另外,企业也可以利用云厂商服务来演练自己的容灾能力。除了应对硬件设备的灾难外,企业还会有其他挑战,包括流量冲击、引入不合理依赖、依赖环节不可用或者延迟高等。
上述建议适合大部分企业。但确实还有一些企业本身规模庞大,对业务的可用性要求极高,同时自身也有非常强悍的技术能力。在上述方案尚不能满足需求时,多云就成了一个待考察的选项了。在单云就能满足要求的情况下盲目追求多云有点像是“何不食肉糜”了。毕竟IT选型第一目标是:适用。