10月20日凌晨,亚马逊网络服务(Amazon Web Services,简称AWS)发生大规模中断,导致包括Facebook、Snapchat、Coinbase、Venmo、Slack等在内的众多网站和应用程序无法访问,甚至波及美国拉瓜地亚机场的值机系统,造成全球范围内的网络混乱。
亚马逊表示,问题起始于太平洋时间午夜后不久,源于其位于弗吉尼亚北部的US-EAST-1区域。这是AWS历史最悠久、规模最大的云计算中心,也是全球在线服务的核心节点。凌晨2点后,AWS表示中断原因是旗下数据库服务DynamoDB的DNS(域名系统)解析故障,使得大量依赖该系统的网站无法找到正确的数据地址。
根据追踪网站DownDetector的数据,与此次中断相关的报告一度超过800万份。受影响的不仅包括社交媒体平台、金融交易应用和在线游戏平台,还涉及英国政府网站和税务系统,以及智能家居设备如Ring门铃等。专家指出,这种依赖云端连接的消费产品在网络故障期间同样陷入瘫痪,凸显出智能生态的脆弱一面。
位于弗吉尼亚州阿什本的亚马逊网络服务数据中心(又称US-EAST-1)的鸟瞰图。(图片来源:路透社)
亚马逊在凌晨3时35分宣布“核心DNS问题已完全缓解”,并表示大部分服务恢复运行,但Lambda和EC2等核心计算平台仍出现积压请求。至早上8时43分,亚马逊确认已“缩小网络连接问题来源”,并将根本原因归咎于“负责监控网络负载均衡器健康状况的底层内部子系统”。截至当日上午,多数主要服务已恢复正常,但部分地区仍出现间歇性连接问题。
尽管亚马逊否认此次事件与网络攻击有关,网络安全专家仍认为这次中断是对全球数字基础设施的又一次警钟。伦敦国王学院副教授艾巴尔斯·通克多根(Albars Tuncodgan)指出,这暴露了“技术单一文化”的风险:“我们在数字世界中形成了一种类似农业‘单一栽培’的结构——当一切都依赖于单一供应商或平台时,一个小故障就可能造成系统性崩溃。如果类似漏洞被恶意行为者利用,后果将更为严重。”
布法罗大学计算机科学教授特夫菲克·科萨尔(Tevfik Kosar)也表示,现代生活几乎所有日常应用,从电子邮件、银行业务到旅行预订和娱乐流媒体,都建立在云服务之上。“任何一家云提供商的系统出现问题,都可能影响数亿人。”
事实上,AWS并非首次在US-EAST-1区域发生重大宕机。自2017年以来,该地区已多次出现大范围服务中断。尽管AWS在全球设有多个备份区域,但不少企业和机构并未充分部署冗余架构,在主节点故障时无法迅速切换至其他云区域或服务提供商。
技术专业组织IEEE高级成员Vaibhav Tupe指出:“这次事件再次表明,即使是最大的云供应商,当核心控制系统发生故障时,也可能出现级联式瘫痪。这将加速业界转向‘多云’与‘多区域架构’,把分散化作为基础弹性的新标准。”
去年,网络安全公司CrowdStrike的一次软件升级错误也曾导致全球范围的混乱,造成航班停飞和医院系统瘫痪,显示出数字世界中“单点失效”的普遍风险。专家认为,虽然亚马逊、谷歌和微软等科技巨头的服务通常能在数小时内恢复,但这一事件再次提醒各方,现代社会的运行高度依赖少数基础服务提供商,而一旦这些系统出现故障,其影响将远超技术层面。
更新时间:2025-10-22
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号