Skip to content

2019-01-02下午

事故类型

局部故障

事故过程

  1. 运营通知开发,A2区客户发现 station 的前后端版本不一致
  2. TODO

事故时长

TODO

事故原因

刚刚的问题是这样的:

A2上面的master分支不知道为什么在一个错误的节点上,错误节点是佩琳上按路线生成分拣序号的回滚节点,时间是12-18号

然后我在发版本的时候是从线上跑的节点拉的代码,但是全量的时候看到工具提示当前节点不是master之上要我rebase, 于是我没有认真看分支情况就直接rebase了

所以全量之后前后端不一致导致了问题


下午后来出了两个问题,

一个是异步报错,原因是gmdeploy删除了task引用的station工程目录, 这个问题通过修改task的配置来规避,把引用station的目录挪出www就好了,

另一个配送单打印报错的问题是今天上的这个停服的功能本身的错误,前端梳理接口的时候是在master上梳理的, master上这个接口确实没有被软件外的地方使用,但是A2的代码还没有更新,这个接口同时被station老打印配送单页面使用, 所以报错的都是A2,A1机器都没有问题。 我已经把这个功能从A2撤回了,和产品沟通了一下,等到A2迭代的时候把功能从master自然带过来就好

解决思路

  • 限制 git A2-master 权限
  • 定期 check 分支和实际运行的版本差异