服务治理-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

服务治理

阅读量：2400 次

发布时间：2019-05-10

本文共 612 字，大约阅读时间需要 2 分钟。

1.全服务需进行http/rpc压测，并适当进行机器扩容

1）计算单实例下机器可承受的最大qps
压测结果以服务器实际接收到的qps为准，如下图
在单接口qps50时，服务延迟逐渐升高，故取40qps时服务器实际接收到的qps作为单实例稳定运行qps值。此时服务器实际接收的qps为91（单接口50，其余接口根据转换比设置，故总qps会大于50，并且部分发出的qps可能因为网络延迟丢失，所以取服务器实际接收到的qps为准）
2）实例扩容至 2✖️实例数✖️压测qps>线上当前峰值总qps

在这里插入图片描述

2.熔断时间设置

查出每个接口的TP999峰值，单独设置每个接口的熔断时间设置为该值*2

3.慢查询治理

慢查询会拖垮整个系统的性能，可通过优化sql、缓存等方案进行治理
我们服务慢查询治理后的效果

4.服务巡检

大多数错误会因为报警阈值的触发而被发现，也有少部分问题需要服务巡检去观察。
所以需要定时对系统进行服务巡检，可以发现很多问题，比如某段时间请求数每天都在暴涨，如果不是业务的扩长，就要考虑你的接口是不是被攻击了，或者有没有人在没告知的情况下就接入了你的接口之类的。
举例可观察的值如：
1.服务总请求数
2.请求错误数
3.慢查询数
4.CPU峰值
5.内存使用
6…

5.上下游依赖梳理与限流

死道友不死贫道的做法，避免下游对接口的滥用导致服务出现问题，故需要梳理清楚依赖关系并适当进行限流。
限流需设置告警并周知下游

转载地址：http://wriob.baihongyu.com/

你可能感兴趣的文章

疯狂的十天计划开启（二） (改）

自动化运维平台的流程草图

又一个轮回（r14笔记第100天）

通过shell脚本检测MySQL服务信息

Greenplum集群部署小记

通过java画文本格式的统计图

MySQL存储过程的权限问题

大分区表的手工并行优化

从“悲剧”的几个运维场景谈谈运维开发的痛点

运维工作中几点深刻的经验和教训

本周搞几件事情，说说你的计划吧

又一个轮回（r15笔记第100天）

在oracle实践学习位运算第一篇

通过sql语句分析足彩

生产环境sql语句调优实战第七篇

一个oracle查询引起的bug

通过shell来比较oracle和java中的字符串使用

关于纠结的recycle pool的设置

清华梦的粉碎读后感--论理想主义者王垠

生活中的优化和向往(r11笔记第72天)

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-07-05 19:42:33 当前IP: 3.148.109.5 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我