面试官:你都监控 Redis 哪些指标?

DevOps技术栈

共 3861字,需浏览 8分钟

 · 2021-11-05

原文链接:blog.51cto.com/yht1990/2503819

监控 Redis 哪些指标?
这是一个常见的面试题,直接上菜

监控指标

  • 性能指标:Performance
  • 内存指标: Memory
  • 基本活动指标:Basic activity
  • 持久性指标: Persistence
  • 错误指标:Error
  • 性能指标:Performance


NameDescription
latencyRedis响应一个请求的时间
instantaneous_ops_per_sec平均每秒处理请求总数
hi rate(calculated)缓存命中率(计算出来的)


内存指标: Memory


NameDescription
used_memory已使用内存
mem_fragmentation_ratio内存碎片率
evicted_keys由于最大内存限制被移除的key的数量
blocked_clients由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端


基本活动指标:Basic activity


NameDescription
connected_clients客户端连接数
conected_lavesslave数量
master_last_io_seconds_ago最近一次主从交互之后的秒数
keyspace数据库中的key值总数


持久性指标: Persistence


NameDescription
rdb_last_save_time最后一次持久化保存磁盘的时间戳
rdb_changes_sice_last_save自最后一次持久化以来数据库的更改数


错误指标:Error


NameDescription
rejected_connections由于达到maxclient限制而被拒绝的连接数
keyspace_misseskey值查找失败(没有命中)次数
master_link_down_since_seconds主从断开的持续时间(以秒为单位)


监控方式


  • redis-benchmark
  • redis-stat
  • redis-faina
  • redislive
  • redis-cli
  • monitor
  • showlog
  • 1)get:获取慢查询日志
  • 2)len:获取慢查询日志条目数
  • 3)reset:重置慢查询日志


相关配置:

slowlog-log-slower-than 1000 # 设置慢查询的时间下线,单位:微秒slowlog-max-len 100 # 设置慢查询命令对应的日志显示长度,单位:命令数
  • info(可以一次性获取所有的信息,也可以按块获取信息)
  • 1)server:服务器运行的环境参数
  • 2)clients:客户端相关信息
  • 3)memory:服务器运行内存统计数据
  • 4)persistence:持久化信息
  • 5)stats:通用统计数据
  • 6)Replication:主从复制相关信息
  • 7)CPU:CPU使用情况
  • 8)cluster:集群信息
  • 9)Keypass:键值对统计数量信息


终端info命令使用


  • ./redis-cli info 按块获取信息 | grep 需要过滤的参数
  • ./redis-cli info stats | grep ops


交互式info命令使用

 #./redis-cli> info server

性能监控


redis-cli info | grep ops # 每秒操作数

内存监控


[root@CombCloud-2020110836 src]# ./redis-cli info | grep used | grep humanused_memory_human:2.99M  # 内存分配器从操作系统分配的内存总量used_memory_rss_human:8.04M  #操作系统看到的内存占用,top命令看到的内存used_memory_peak_human:7.77M # redis内存消耗的峰值used_memory_lua_human:37.00K   # lua脚本引擎占用的内存大小


由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端

[root@CombCloud-2020110836 src]# ./redis-cli info | grep blocked_clientsblocked_clients:0

由于最大内存限制被移除的key的数量

[root@CombCloud-2020110836 src]# ./redis-cli info | grep evicted_keysevicted_keys:0  #

内存碎片率

[root@CombCloud-2020110836 src]# ./redis-cli info | grep mem_fragmentation_ratiomem_fragmentation_ratio:2.74

已使用内存

[root@CombCloud-2020110836 src]# ./redis-cli info | grep used_memory:used_memory:3133624

基本活动指标


redis连接了多少客户端


通过观察其数量可以确认是否存在意料之外的连接。如果发现数量不对劲,就可以使用lcient list指令列出所有的客户端链接地址来确定源头。

[root@CombCloud-2020110836 src]# ./redis-cli info | grep connected_clientsconnected_clients:1[root@CombCloud-2020110836 src]# ./redis-cli info | grep connectedconnected_clients:1   # 客户端连接数量connected_slaves:1   # slave连接数量

持久性指标


[root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_last_save_timerdb_last_save_time:1591876204  # 最后一次持久化保存磁盘的时间戳[root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_changes_since_last_saverdb_changes_since_last_save:0   # 自最后一次持久化以来数据库的更改数

错误指标


由于超出最大连接数限制而被拒绝的客户端连接次数,如果这个数字很大,则意味着服务器的最大连接数设置得过低,需要调整maxclients

[root@CombCloud-2020110836 src]# ./redis-cli info | grep connected_clientsconnected_clients:1

key值查找失败(没有命中)次数,出现多次可能是被hei ke gongjji

[root@CombCloud-2020110836 src]# ./redis-cli info | grep keyspacekeyspace_misses:0

主从断开的持续时间(以秒为单位)

[root@CombCloud-2020110836 src]# ./redis-cli info | grep rdb_changes_since_last_saverdb_changes_since_last_save:0

复制积压缓冲区如果设置得太小,会导致里面的指令被覆盖掉找不到偏移量,从而触发全量同步

[root@CombCloud-2020110836 src]# ./redis-cli info | grep backlog_sizerepl_backlog_size:1048576

通过查看sync_partial_err变量的次数来决定是否需要扩大积压缓冲区,它表示主从半同步复制失败的次数

[root@CombCloud-2020110836 src]# ./redis-cli info | grep sync_partial_errsync_partial_err:1

redis性能测试命令

./redis-benchmark -c 100 -n 5000

说明:100个连接,5000次请求对应的性能。


- END -

 推荐阅读 

Kubernetes 企业容器云平台运维实战 
Linux运维工程师的 6 类好习惯和 23 个教训
一名运维小哥对运维规则的10个总结,收藏起来
NoOps 来了,DevOps 工程师的未来在何方?
终于明白了 DevOps 与 SRE 的区别!
我的云服务器被植入挖矿木马,CPU飙升200%
Kubernetes上生产环境后,99%都会遇到这2个故障
如何用 Kubernetes 实现 CI/CD 发布流程?| 漫画
K8s kubectl 常用命令总结(建议收藏)
Kubernetes 的这些核心资源原理,你一定要了解
我在创业公司的 “云原生” 之旅
基于Nginx实现灰度发布与AB测试
编写 Dockerfile 最佳实践
12年资深运维老司机的成长感悟



点亮,服务器三年不宕机

浏览 29
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报