核心问题
为什么系统负载到 80% 后延迟突然爆炸?
工程困境
数据库连接池从 20 调到 200,吞吐没有提升,反而更慢。因为瓶颈不是连接数,而是数据库服务能力。
思想模型
排队系统看三个量:
到达率:请求进来多快
服务率:系统处理多快
队列长度:等待有多少
当到达率接近服务率,等待时间会非线性上升。
好判断
优化前先问:
瓶颈在哪里?
队列在哪里?
服务时间是否波动很大?
连接池变大是在提升服务率,还是制造更多并发排队?
Atlas Action
找一个慢接口,记录:请求率、平均耗时、P95、队列长度或连接等待时间。
小结
队列不会消失,只会藏在你没观察的地方。