核心问题
为什么不能稳定复现的问题,很难稳定修复?
真实场景
用户反馈“偶尔提交失败”。测试试了几次没有出现,工程师看日志也没发现明显错误。于是团队说:“先观察。”
几天后,同样问题再次出现,影响了更重要的客户。
常见误区
坏判断是:
这个 Bug 很随机,先猜一个原因修了再说。
如果不知道触发条件,就很难确认修复是否真的有效。
工程视角
复现不是重复点击几次,而是找到触发问题的条件组合:
- 哪个用户?
- 哪个入口?
- 哪个浏览器或设备?
- 哪个数据状态?
- 哪个时间段?
- 是否和并发、缓存、权限有关?
复现路径越精确,修复质量越高。
PM 可以怎么做
PM 最适合帮助补齐上下文:
- 收集用户操作路径。
- 记录时间、账号、设备、截图。
- 标记业务状态。
- 区分“必现”“高概率”“偶现”。
- 协助判断影响范围。
Atlas Action
建立一个 Bug 复现模板:
用户/账号:
发生时间:
入口页面:
前置数据状态:
操作步骤:
期望结果:
实际结果:
出现频率:
影响范围:
小结
复现是修复的地基。
PM 提供的上下文越完整,工程师越能从“猜原因”进入“验证原因”。