事件背景
亚马逊(Amazon)近期针对其电商业务频发的系统故障召开了紧急工程会议。会议旨在深度剖析近期出现的技术问题,特别是与生成式AI编码工具相关的故障趋势。
核心问题分析
根据会议简报,亚马逊发现近几个月系统事件呈现影响范围大、变动频繁等特征,主要诱因包括:
- 生成式AI辅助开发: 简报指出,新型生成式AI的使用方式目前尚缺乏完善的最佳实践与防护措施。
- 代码部署错误: 本月亚马逊网站及App出现的近六小时宕机,已被确认涉及一次错误的“软件代码部署”。
应对措施与管理调整
为了降低技术风险,亚马逊高级副总裁特雷德韦尔(Treadwell)宣布了新的工程管理流程:
- 分级审批制: 未来所有由初级或中级工程师利用 AI 协助完成的代码改动,均必须由更资深的工程师进行审批签署。
- 确立防护标准: 公司将着手建立更严格的 AI 编程规范,以应对生成式内容带来的不确定性。
—
标签:#亚马逊 #生成式AI #AI编程 #软件工程 #系统宕机 #技术管理