核心问题

系统如何随时间演化?

工程困境

单次请求看起来没问题,但系统跑起来以后会出现延迟、重试、队列、缓存过期、流量尖峰和雪崩。

静态代码正确,不代表动态系统稳定。

思想模型

模型思维关注变量之间的关系:

流量 -> 队列 -> 延迟 -> 重试 -> 更多流量

你要看的不是一个函数,而是函数之间的反馈和时间延迟。

Atlas Action

选一个接口,画出:

输入流量
处理能力
队列
失败重试
下游依赖
用户可见延迟

小结

系统不是代码快照,而是随时间变化的动态过程。