博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
服务治理
阅读量:2400 次
发布时间:2019-05-10

本文共 612 字,大约阅读时间需要 2 分钟。

1.全服务需进行http/rpc压测,并适当进行机器扩容

1)计算单实例下机器可承受的最大qps

压测结果以服务器实际接收到的qps为准,如下图
在单接口qps50时,服务延迟逐渐升高,故取40qps时服务器实际接收到的qps作为单实例稳定运行qps值。此时服务器实际接收的qps为91(单接口50,其余接口根据转换比设置,故总qps会大于50,并且部分发出的qps可能因为网络延迟丢失,所以取服务器实际接收到的qps为准)
2)实例扩容至 2✖️实例数✖️压测qps>线上当前峰值总qps

在这里插入图片描述

2.熔断时间设置

查出每个接口的TP999峰值,单独设置每个接口的熔断时间设置为该值*2

3.慢查询治理

慢查询会拖垮整个系统的性能,可通过优化sql、缓存等方案进行治理

我们服务慢查询治理后的效果
在这里插入图片描述

4.服务巡检

大多数错误会因为报警阈值的触发而被发现,也有少部分问题需要服务巡检去观察。

所以需要定时对系统进行服务巡检,可以发现很多问题,比如某段时间请求数每天都在暴涨,如果不是业务的扩长,就要考虑你的接口是不是被攻击了,或者有没有人在没告知的情况下就接入了你的接口之类的。
举例可观察的值如:
1.服务总请求数
2.请求错误数
3.慢查询数
4.CPU峰值
5.内存使用
6…
在这里插入图片描述

5.上下游依赖梳理与限流

死道友不死贫道的做法,避免下游对接口的滥用导致服务出现问题,故需要梳理清楚依赖关系并适当进行限流。

限流需设置告警并周知下游

转载地址:http://wriob.baihongyu.com/

你可能感兴趣的文章
疯狂的十天计划开启(二) (改)
查看>>
自动化运维平台的流程草图
查看>>
又一个轮回(r14笔记第100天)
查看>>
通过shell脚本检测MySQL服务信息
查看>>
Greenplum集群部署小记
查看>>
通过java画文本格式的统计图
查看>>
MySQL存储过程的权限问题
查看>>
大分区表的手工并行优化
查看>>
从“悲剧”的几个运维场景谈谈运维开发的痛点
查看>>
运维工作中几点深刻的经验和教训
查看>>
本周搞几件事情,说说你的计划吧
查看>>
又一个轮回(r15笔记第100天)
查看>>
在oracle实践学习位运算 第一篇
查看>>
通过sql语句分析足彩
查看>>
生产环境sql语句调优实战第七篇
查看>>
一个oracle查询引起的bug
查看>>
通过shell来比较oracle和java中的字符串使用
查看>>
关于纠结的recycle pool的设置
查看>>
清华梦的粉碎读后感--论理想主义者王垠
查看>>
生活中的优化和向往(r11笔记第72天)
查看>>