核心问题

为什么系统负载到 80% 后延迟突然爆炸?

工程困境

数据库连接池从 20 调到 200,吞吐没有提升,反而更慢。因为瓶颈不是连接数,而是数据库服务能力。

思想模型

排队系统看三个量:

到达率:请求进来多快
服务率:系统处理多快
队列长度:等待有多少

当到达率接近服务率,等待时间会非线性上升。

好判断

优化前先问:

瓶颈在哪里?
队列在哪里?
服务时间是否波动很大?
连接池变大是在提升服务率,还是制造更多并发排队?

Atlas Action

找一个慢接口,记录:请求率、平均耗时、P95、队列长度或连接等待时间。

小结

队列不会消失,只会藏在你没观察的地方。