多云并非避免云故障的最优手段，同城容灾、数据备份等就可以解决

　　在单云就能满足要求的情况下盲目追求多云有点像是“何不食肉糜”了。毕竟IT选型第一目标是：适用。

　　近日，某云厂商故障问题引起业内关注。有人提出，企业是否要选择其他方式来避免云故障损失，其中多云部署被多次提出。但同时不少人持反对意见，认为从性价比、技术实力等考虑多云并不现实。有意思的是，几乎无人质疑云计算比自建数据中心更为安全稳定。

　　首先需要确认一点：在全球范围内主流云厂商的故障时有发生。例如亚马逊AWS在2017年2月，就曾因一条错误指令引起宕机，影响了包括Slack、Quora和Trello在内的很多企业平台,停机4小时。去年9月，微软Azure数据中心还意外遭雷劈发生故障。

　　有网友评论，凡是IT都有故障概率，相对于传统IT单机，云计算已经通过大规模调度降低了故障率，大多数云厂商都声明可用性在99.9%-99.999%之间，且多数在故障后恢复很快。

　　知名市场研究机构Gartner旗下的CloudHarmony网站通过对48家云服务商故障发生的次数和市场监测表明，主流云厂商整体宕机时间在大幅缩短，意味着云厂商技术更加成熟，整体服务稳定性在逐年提高。

　　其次，多部署几个云就可以避免云故障带来的损失?亚马逊AWS首席执行官Andy
Jassy三年前就曾公开表示，使用多个云服务商的做法性价比不高。他认为，如果企业想走多云之路，最基本的要实现最底层的标准化，但是现在的云平台大都不同。其次，要维持多个堆栈的运行，不仅对资源要求高，而且昂贵，这对很多人来讲都是件伤脑筋的事。

　　Electric Cloud 公司的首席技术官兼联合创始人Anders
Wallgren也认为，企业在尝试使用多云战略之前，一定要确保自己真正了解云计算。举个例子，企业团队可能具备使用多个 SaaS
应用程序的能力——但并不表示企业就能在多个平台上管理多个 IaaS 环境。

　　而修理成本、日常管理和维护成本等也是IT决策者们要清醒认识的问题，如果只是奔着避免云故障的目标，最后可能发现要付出巨大的成本。

　　因此，对多云持犹豫态度的专家提出了一个更为现实的选项：相比用多云来解决稳定问题，更务实的做法是充分利用现有云服务商的最佳实践，优化自身系统的可用性。

　　云厂商基本已提供完善的容灾架构设计，包括冷备、热备、同城双活、异地多活等策略，可以针对系统可用级别与成本、效率综合考虑。对于不太重要的业务可以基于冷备或者热备的方案;对于比较重要的业务至少具备同城双活的能力;对于非常重要的核心业务需要考虑异地多活。且基础云产品基本都做到了跨可用区容灾，整体可用性成本很低。

　　举例来说，如果做了同城容灾，西南1的C机房故障，至少西南
1还有A、B等其他机房做备份。如果做了两地容灾策略，西南1故障，还有华南1、华东2可以用。基本上对于当前99%以上的企业而言，已经足以满足其可靠性要求。

　　另外，企业也可以利用云厂商服务来演练自己的容灾能力。除了应对硬件设备的灾难外，企业还会有其他挑战，包括流量冲击、引入不合理依赖、依赖环节不可用或者延迟高等。

　　上述建议适合大部分企业。但确实还有一些企业本身规模庞大，对业务的可用性要求极高，同时自身也有非常强悍的技术能力。在上述方案尚不能满足需求时，多云就成了一个待考察的选项了。在单云就能满足要求的情况下盲目追求多云有点像是“何不食肉糜”了。毕竟IT选型第一目标是：适用。