核心问题
PM 在 Bug 排查中应该做什么,不应该做什么?
真实场景
线上故障发生后,群里同时出现客户截图、销售催促、老板追问、工程师排查。PM 很容易变成传话筒,也可能因为焦虑不断打断工程师。
真正有价值的 PM,会让信息更清晰,而不是让现场更嘈杂。
常见误区
坏判断是:
PM 不写代码,所以只能催进度。
催促很少能缩短排障时间,反而会增加认知负担。
工程视角
Bug 排查需要三类信息:
- 复现信息:怎么发生的。
- 影响信息:影响谁、影响多大。
- 决策信息:是否回滚、降级、补偿、公告。
PM 的优势在后两类,也能补齐第一类上下文。
PM 可以怎么做
你应该承担这些任务:
- 收集并整理复现路径。
- 判断影响范围和优先级。
- 管理外部沟通节奏。
- 协助决定是否降级或回滚。
- 记录时间线,方便复盘。
你不应该做的是:
- 每两分钟问一次“好了没”。
- 在没有证据时指定技术原因。
- 让工程师同时面对多个业务方。
Atlas Action
线上 Bug 出现后,PM 先开一个简短记录:
当前现象:
影响范围:
首次发现时间:
复现路径:
当前负责人:
下一次状态更新时间:
小结
PM 参与 Bug 排查的价值,不是替工程师修代码,而是降低现场混乱度。
信息越清晰,工程排障越快。