核心问题

如果某个人离开,系统还能运行吗?

英雄文化短期救火,长期制造组织脆弱性。

工程表现

  • “这块只有 Alice 懂”
  • 发布靠某人手动操作
  • 事故靠某人半夜排查
  • 本地脚本只在某人电脑上
  • 关键知识不在文档和测试里

改善

  • pairing
  • owner rotation
  • runbook
  • tests
  • shared dashboard
  • incident review

小结

目标不是让英雄更强,而是让系统不再需要英雄。