【2025年11月06日讯】(记者欣思西雅图报导)2025年10月下旬,总部位于西雅图地区的全球两大云端服务巨头——亚马逊与微软——在一周之内相继发生大规模故障,影响遍及全球。从电子邮件、线上会议到游戏平台与企业系统,可能有数以亿计的用户短暂「离线」。这场云端风暴不仅暴露出技术层面的脆弱,也让外界再次关注:当现代生活的每一次点击、通讯与交易都依赖在几朵「云」之上,全球数位运行是否正变得过于集中、过于脆弱?
两场「云风暴」
2025年10月20日(美东时间)上午约10点,亚马逊旗下的云端平台Amazon Web Services(AWS)发生大规模中断,影响遍及北美、欧洲及部分亚洲地区。许多依赖亚马逊云的网站与应用,包括线上购物、串流影音、银行服务与智能家居系统,当时都出现无法登入或长时间无法回应的情况。亚马逊事后表示,这起事件是由于亚马逊云内部的域名系统(DNS)设定出现异常,导致服务器之间无法正确定位与连线,进而造成多项云端服务接连中断。整个中断持续近15小时,直到当日晚间才全面恢复。
仅仅一周之后,2025年10月29日(美东时间)中午约12点,微软旗下的云端平台Microsoft Azure也发生大规模故障,造成全球用户受到影响。最先受到冲击的是微软Teams与Outlook应用程序,许多用户发现无法登入或寄送邮件;随后,Xbox、Copilot、Defender等服务也相继出现异常,连微软自己的云端管理入口Azure Portal都一度无法开启。微软表示,问题源于系统设定出现错误,导致部分网络节点无法正常运作,进而引起多项服务同时中断。这场中断持续约11小时,直到当日晚间11点14分才全面恢复。这次事件被视为微软近年最严重的服务中断之一。
短短一周内,全球两大云端服务商相继出现长时间中断事件,让人们重新关注云端基础设施的集中化风险。云服务早已渗透到日常生活与企业运作的每个角落。当少数几家公司承载了全球大部分的数位运行时,即便是一场小小的设定错误,也可能在瞬间影响数以亿计的用户与企业。
「小错」如何酿成「大灾」
在过去,人们普遍认为云端服务意味著「稳定、安全、永不宕机」。毕竟,亚马逊云与微软云拥有全球最先进的资料中心与多层备援系统,理应能抵御各种突发状况。
但两起接连发生的云端中断事件显示,再强大的技术,也难以完全避免集中化所带来的风险。
在现代的云端架构中,底层服务之间如同齿轮般紧密连动。当其中一个环节出现错误,就可能引发连锁反应——从数据库、身分验证、档案储存,到应用服务都可能受到波及。一个小小的设定失误,便足以让数以万计的系统陷入停摆。
而当全球多数企业与机构都依赖同一套「云脑」时,一次故障不仅是技术问题,更可能演变成全球性的业务中断。
对一般使用者而言,这样的风暴往往来得悄无声息。
应用程序可能一直不能刷新页面、邮件无法发送、支付页面打不开、智能音箱不回应,或是线上会议无法登入。这些看似「网络卡顿」的现象,其实往往源自云端平台的服务中断。如今,从娱乐、通讯到金融交易,我们的日常生活早已与云端密不可分。
集中化的代价与未来的韧性
云计算本意是让资源像水、电一样随取随用,但如今,它更像是一张庞大的「数位电网」,而开关却掌握在少数几家公司手中。当这些关键平台中的任一家出现问题,影响的就不只是单一服务,而是整个数位生态链。
全球超过六成的网站与应用运行在三大云服务商之上——亚马逊云、微软云和谷歌云。这种高度集中虽然提升了效率与成本效益,却也让风险被放大。
专家指出,未来企业与政府机构需要重新思考云端依赖策略,采取更分散的架构,例如「多云部署」或「混合云模式」,以避免单一平台出现问题时导致全面停摆。同时,也需要在基础层面建立更多备份机制与跨平台互通标准,让数位基础设施具备自我修复与快速转移的能力。
对个人与社会而言,这两次事件也是一次警示。当人们的通讯、工作、娱乐甚至医疗系统都依赖云端时,稳定运作的背后,其实建立在极少数企业的肩膀上。
技术越集中,风险越集中。未来的关键,或许不在于打造「更强的云」,而在于建构一个能承受错误、分散风险、并在危机中仍能维持运转的数位世界。
责任编辑:舜华
常见问题
AWS的大规模中断发生在何时、持续多久?
2025年10月20日(美东时间)上午约10点,亚马逊旗下的Amazon Web Services(AWS)发生大规模中断,整个中断持续近15小时,直到当日晚间才全面恢复。
AWS中断的原因是什么?
亚马逊事后表示,这起事件是由于亚马逊云内部的域名系统(DNS)设定出现异常,导致服务器之间无法正确定位与连线,进而造成多项云端服务接连中断。
微软Azure的故障是何时发生的?
2025年10月29日(美东时间)中午约12点,微软旗下的Microsoft Azure发生大规模故障,最先受冲击的是Teams与Outlook,随后Xbox、Copilot、Defender等服务也相继异常,这场中断持续约11小时,直到当日晚间11点14分才全面恢复。
全球大部分网站运行在哪几家云服务商上?
全球超过六成的网站与应用运行在三大云服务商之上——亚马逊云、微软云和谷歌云,这种高度集中虽提升了效率,却也让风险被放大。
专家建议如何降低云端集中化风险?
专家指出,未来企业与政府机构需采取更分散的架构,例如「多云部署」或「混合云模式」,并建立更多备份机制与跨平台互通标准,让数位基础设施具备自我修复与快速转移的能力。






