2019 01 03
2019-01-03
事故类型
局部故障
事故过程
- 客户投诉订单状态未改变
- 发现 crontab 脚本 批量修改订单为配送中 失败
事故时长
12 小时
事故原因
部分客户客户正在灰度,所以需要两个不同的脚本(灰度脚本和全量脚本)分别刷灰度客户和非灰度客户。迁移脚本后没有运行两个脚本,造成这个脚本报错
事故反思
没有做测试,导致客户投诉后才发现这个问题
解决思路
- 运维结构变动之后应该做一些基础的测试
- 脚本放到固定的分支,固定的工程
局部故障
12 小时
部分客户客户正在灰度,所以需要两个不同的脚本(灰度脚本和全量脚本)分别刷灰度客户和非灰度客户。迁移脚本后没有运行两个脚本,造成这个脚本报错
没有做测试,导致客户投诉后才发现这个问题