运维处理方案
运维值日与快速响应
值日
-
工作日
暂不特别安排值日,用值日系统判断人力。
-
节假日
- 每天保证有2人(一主一备)
- 主负责人要保证基本在家。
- 备份人出行需要带电脑,有网络。
每次假期前根据人员出行计划定节假日的值日人选。
-
补偿
值日主负责人单人单日0.5调休,备负责人0.25调休。
-
人员
所有选定参与运维值日的人员在运维群内确定。
快速响应
- 所有人员:10分钟内报告自己状态。
- 当天值日人员:分钟级进入处理状态(同时报告状态)。
响应不及时处罚
-
值日人员
- 不及时处理的基本处罚:取消补偿,处罚0.25假期。
- 不及时处理导致事故:除了基本处罚外,按照事故类型增加单次处罚,处罚根据事故实际情况确定。
-
所有人员
- 不及时响应:处罚0.25调休。
- 事故需要支持联系不上:按照事故类型处罚。
-
事故类处罚
因个人响应不及时导致事故(10分钟以上),处罚标准500元起。
oncall总结 -- 运维
- 每次oncall事件后,总结问题原因发到群里,大的事故(10分钟以上)组织会议总结。
-
快速响应统计 - 统计每个人的响应情况。
xxx 值日/非值日 响应时长
说明
所有oncall都需要按照流程来,暂时不包含每周的随机oncall测试。
富军负责跟踪执行的情况,每周汇报。