核心问题
系统还能增长多少?
工程困境
上线活动前,团队只问“服务器够不够”。真正要问的是:瓶颈在哪,扩容路径是什么,失败时怎么降级。
思想模型
容量规划 = 需求预测 + 服务能力 + 瓶颈识别 + 降级策略。
检查项
峰值流量
P95 延迟
数据库连接
队列积压
worker 处理率
第三方限额
缓存命中率
降级开关
Atlas Action
为一次课程大促写容量表:预计 RPS、关键接口、瓶颈、扩容手段、降级策略、回滚方案。
小结
容量规划不是买更多机器,而是知道系统在哪里先断。
系统还能增长多少?
上线活动前,团队只问“服务器够不够”。真正要问的是:瓶颈在哪,扩容路径是什么,失败时怎么降级。
容量规划 = 需求预测 + 服务能力 + 瓶颈识别 + 降级策略。
峰值流量
P95 延迟
数据库连接
队列积压
worker 处理率
第三方限额
缓存命中率
降级开关
为一次课程大促写容量表:预计 RPS、关键接口、瓶颈、扩容手段、降级策略、回滚方案。
容量规划不是买更多机器,而是知道系统在哪里先断。