(网经社讯)10月20日消息,亚马逊云计算服务(AWS)在美国东部地区的US-EAST-1数据中心发生大规模故障,导致全球数千个网站和应用程序陷入瘫痪。此次服务中断持续约15小时,是自2024年CrowdStrike系统故障以来全球最大规模的网络中断事件。
网经社跨境电商台(CBEC.100EC.CN)获悉,故障起源于亚马逊位于弗吉尼亚州北部的US-EAST-1数据中心区域,这是AWS运营历史最悠久、规模最大的数据中心集群之一。技术分析表明,问题的核心在于“DynamoDB API的DNS解析异常”,导致系统无法将DynamoDB数据库服务的名称转换为有效的网络地址。尽管服务器本身仍在运行,但由于DNS解析失败,用户请求无法被正确导向目标服务。
据网络监测平台Downdetector统计,全球有超过400万用户报告了服务异常。受影响的服务范围广泛,包括亚马逊自家的电商网站、Alexa语音助手和Amazon Prime Video,以及金融平台PayPal旗下Venmo、在线券商Robinhood、游戏平台Steam、Roblox和社交媒体Snapchat等。英国多家银行和电信服务提供商也受到波及。
对于亚马逊平台上的卖家而言,此次故障导致后台管理系统无法正常访问,商品页面出现“内部错误”提示,账户余额显示异常。卖家在故障期间无法处理订单、调整广告或联系客服,正值万圣节和“黑色星期五”等年终促销活动前的关键准备期。
这已是过去五年内US-EAST-1区域至少第三次引发全球性互联网瘫痪。专家指出,此次事件凸显了现代数字服务对少数几家全球云平台的深度依赖。萨里大学计算机科学系研究主任尼桑·萨斯特里表示:“根本问题在于,几乎所有大型企业都在使用同一家底层服务商,形成了单点故障的风险。”
云计算服务中断对企业的财务影响显著。保险经纪公司McGill and Partners的美国网络业务负责人瑞安·格里芬指出:“对大型企业而言,数小时的云服务中断就意味着数百万美元的生产力和收入损失。”尽管发生严重故障,亚马逊股价在事件后反而上涨1.6%,显示市场对其长期前景保持信心。
截至美东时间10月20日早上6点,亚马逊宣布大多数受影响服务已恢复正常运行。然而,此次事件再次引发了对云计算中心化架构稳定性的关注,以及企业过度依赖单一云服务商的风险。