Skip to content

2019 01 03

2019-01-03

事故类型

局部故障

事故过程

  1. 客户投诉订单状态未改变
  2. 发现 crontab 脚本 批量修改订单为配送中 失败

事故时长

12 小时

事故原因

部分客户客户正在灰度,所以需要两个不同的脚本(灰度脚本和全量脚本)分别刷灰度客户和非灰度客户。迁移脚本后没有运行两个脚本,造成这个脚本报错

事故反思

没有做测试,导致客户投诉后才发现这个问题

解决思路

  1. 运维结构变动之后应该做一些基础的测试
  2. 脚本放到固定的分支,固定的工程