Top
首页 > 正文

阿里云宕机、X下云背后:国内企业的“混合多云”竞赛拉开序幕

11月12日傍晚,阿里云的服务出现大面积故障。据阿里云公告,故障原因与某个底层服务组件有关。三个多小时后,阿里云通告称云产品恢复,但部分数据仍可能受到影响。
发布时间:2023-11-14 12:09        来源:赛迪网        作者:赛迪网

新时代的“水电煤”,断电了

人们常说,云服务是新时代的“水电煤”。这周末,他们就体验了一把“断水断电”。

11月12日傍晚,阿里云的服务出现大面积故障。据阿里云公告,故障原因与某个底层服务组件有关。三个多小时后,阿里云通告称云产品恢复,但部分数据仍可能受到影响。

除了阿里自身应用受到影响,依赖云服务的社会设施,同样受到波及:一些外卖派送停止、超市无法结账、停车场不抬杆。部分洗衣机、直饮水机和充电桩们,因为自助服务搭建在云上,停止运转。

对于这次故障来说,“从云的服务状态页来看,这不是某个可用区的故障,而很可能是全球大故障,没有幸免的区域和服务。”有云从业者说,“除非多云可切换,否则无一幸免。”

要想要业务健康持续,真正的解法不是期待某家云厂商“永远健康”,把身家性命托付在同一朵公有云上,而是主动部署混合多云,在受灾时及时切换。有业内人士猜测,此次微博的运行正常,就是因为采用了多家云服务。

“有个很形象的比喻是,大家用电的话,会关心这是三峡的水电、内蒙的火电,还是新疆的风电吗?”某大厂IaaS服务负责人说。客户应当接入的是“电网”,不是电厂;发电厂应该屏蔽区别,提供均一稳定的服务。“单云不出故障,是很好的理想。但单云实际已经开始成为业务的阻碍,而不是促进了。”

便宜又安全,多云成为主流选择

企业在用云时,多云是更安全、也更便宜的选择。

大部分客户已经选择了多云。据分析公司ESG的报告,截至2022年,公有云基础设施用户中有86%正实施多云策略,平均使用2到4个公有云。IDG在三年前的调查发现,55%的组织在“多云策略”中使用了多个云供应商。

多云指的是一个组织用多个公有云。几乎所有企业,都会用多家公司的SaaS服务,但这不是多云的含义。多云是指在基础设施(包含存储、网络和计算)层面,使用多家公有云。这些云的基础设施能够互补,让一家云瘫痪时,企业能把业务切换到其他云上去。

多云的最大优势就是安全。企业在云原生部署中实现了冗余、并规划了灾难恢复。一些云原生公司,已经利用多个云供应商来托管其生产数据的镜像副本。如果一个公有云发生故障,他们能迅速切换到其他公有云上。

这是非常必要的——无论云厂商表示有多少个9的“高可用”、多么完善的异地容灾,本质上都只是承诺,是理想状况,一旦出现问题,他们会用代金券当作“赔偿”。但对企业来说,停摆的业务和流失的客户,可能带来灭顶之灾。主动寻求灾备措施,防止业务停摆,才是正确的思路。

多云的第二个好处是降低成本。这很反直觉,但却是事实。当企业使用单一云的时候,“云服务商会想尽办法让客户很难离开——如果你不能离开,云厂商就可以收取任何费用。”有云从业者说。而多云能够利用平台之间的竞争性定价,自由选取最便宜的服务。

这一点无需赘言。不久前,X(Twitter)回顾了过去一年从AWS搬迁的成果:每年节省超过1亿美元,还将数据的云存储量降低60%,数据的云处理成本降低75%。近期流传甚广的《下云奥德赛》,也引用客户口吻说:你难以想象(单一)云从如此简单的服务,收取了多少钱!

而多云策略,可以让云厂商公平竞价:一些云服务商提供免费的出口,但限制可下载的数据量;另一些则收取名义上的出口费,但不限制下载量。精打细算的公司,就可以根据数据量和访问频率,找出“最便宜”的搭配方式。

多云还有其他好处:访问专有服务,比如谷歌云独有的TPU;为技术员工搭配更顺手的服务;减少延迟来提升体验,或定制服务位置来适应法规。

多云策略,可以让企业拿回掌控业务和数据的主动权,最大化地按照自己的需求——而不是云厂商的最大化收费,来使用云服务。

部署混合多云,现在正是好时机

“如果将云比作水电煤,首先它不应该特别复杂,其次应当促进云原生。不仅在IaaS层面,在PaaS层面也应该能随意取用。现在的云还没做到。”某大厂IaaS业务负责人说。混合多云会是未来的基础设施,这已经成为共识。

“云的大趋势,是单一云-混合云-混合多云”。该人士断言说。云计算的基础能力已经成熟,各主流厂商没有多少差异,云服务应当退回“无感”的基础服务,成为业务的支撑、而不是薄弱点。

基于这种趋势,部分云服务商已经在建设混合多云能力,试图为客户屏蔽掉云的基础设施差异,当好省心的“水电煤”。这种屏蔽掉多云差异、让客户如同使用“一朵云”的思路,正是“混合多云”的服务理念。

以京东云为例,2021年,京东云就发布了业内首个混合多云操作系统“云舰”。它可以帮助企业构建自主可控的混合多云架构,兼容国内外主流的云厂商,如AWS、Azure、谷歌云,以及私有云的VMWare、IBM等,并兼容x86、ARM、Risc-V等架构和操作系统,是目前兼容最多的平台。

京东云人士透露,云舰在PaaS层也能够屏蔽差异,让客户“物理上使用多朵云、业务上体验一朵云”。其支持跨云双活、多云发布,以及多云统一应用平台、一套代码全球发布。在Forrester、中国信通院、亿邦智库等发布的报告中,京东云都以混合多云能力,位列第一阵营。

这种混合多云的能力,在类似此次云服务商大面积故障的时候,对业务持续性就是“救命稻草”。有京东云人士说,云舰不仅能实现同城和异地多活,也是行业唯一可实施“跨云多活”的混合云平台。

事实上,主流云厂商包括阿里云、腾讯云、华为云,都构建了PaaS层面的多云解决方案。第二梯队中领先的Ucloud,也以多云吸引客户。相比主流云厂商,第二梯队更有动力去构建多云服务。

第二梯队对混合多云的实践和推动,源自自身发展需求。有京东云人士透露,京东物流和零售业务早期出海时,海外多个国家并没有京东云自己的IaaS设施。京东云需要为业务团队适配Azure、谷歌云等大厂的服务。

在云舰的支持下,京东云在2个月内,成功对2600个应用完成跨国部署,核心业务在8天完成稳定迁移,节省成本30%以上。来自业务的真实需求,成为京东云“混合多云”的历练场。

在经过自身历练后,这些云厂商开始将“混合多云”的能力开放出来,并且主打“生态开放”策略,帮助客户从IaaS到SaaS全面解绑,能够自由切换在各种主流云服务上。

此外,混合多云伴生的“多芯”,也在今年因为英伟达的芯片封锁,成为客户的主流需求。例如,目前京东云遵循渐进路线,已经完成80%应用的国产化集群适配,实现产业级规模的国产“真替真用”。

阿里云的宕机和X下云,未尝不是帮企业敲醒了警钟:云服务应当从“喧宾夺主”,回归基础设施的“无感服务”。主动部署多云,现在正是最好的时候。

每日必读

专题访谈

合作站点