目录
集群压测基本流程
Step1:压测目标制定
目标qps(绝大部分的性能问题,都可以通过qps来体现)
qps不仅是入口的数值,同时需要关注系统及子系统的性能表现(业务指标+系统指标);
压测的目标系统及重要子系统需要有明确的压测熔断指标(业务指标+系统指标);
Step2:压测准备
- 测试query准备:
- 测试query集合类型配比(模拟真实线上请求场景)
- 测试query的特殊标记(方便后期统计或清理)
- 系统架构:
- 测试环境与线上环境服务隔离,若无法隔离则必须要有明确的止损预案
- 上下游实例数量配比检查
- 上下游连接关系检查
- 测试工具准备(优先业界通用,避免自造轮子)
- 观察(监控)指标梳理
- 降级/止损预案准备
- 测试query准备:
Step3:预压测
- 压测工具以单实例/较低qps请求服务集群,目的:
- 1)预演整个压测流程;
- 2)分析流量分发到各服务的比例;
- 压测工具以单实例/较低qps请求服务集群,目的:
Step4:压测
- 压力应阶段性增长,每个阶段必须要有一定的停留观察时间;
Step5:扫尾工作
- 压测日志保存;
- 压测指标曲线图保存;
- 如若有,回滚fake服务;
- 如若有,关闭实验开关;
- 如若有,清理压测流量记录;
集群压测原则
- 压测前,将压测的流程文档化,以便压测执行过程中查看,尤其对于核心check点/流程务必高亮提示;
- 压测前,务必需要有环境确认的预压测过程,确定环境各部分符合预期;
- 每一步都需要有明确的检查指标,确保测试环境、服务状态符合预期;
- 出现非预期的场景,在无法立即确认问题原因,无法确认问题影响面情况下,应停测试压力,避免持续影响;
版权声明:本文为wenjun258120原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。