面试官:你都监控 Redis 哪些指标?
监控指标
- 性能指标:Performance 
- 内存指标: Memory 
- 基本活动指标:Basic activity 
- 持久性指标: Persistence 
- 错误指标:Error 
- 性能指标:Performance 
| Name | Description | 
|---|---|
| latency | Redis响应一个请求的时间 | 
| instantaneous_ops_per_sec | 平均每秒处理请求总数 | 
| hi rate(calculated) | 缓存命中率(计算出来的) | 
内存指标: Memory
| Name | Description | 
|---|---|
| used_memory | 已使用内存 | 
| mem_fragmentation_ratio | 内存碎片率 | 
| evicted_keys | 由于最大内存限制被移除的key的数量 | 
| blocked_clients | 由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端 | 
基本活动指标:Basic activity
| Name | Description | 
|---|---|
| connected_clients | 客户端连接数 | 
| conected_laves | slave数量 | 
| master_last_io_seconds_ago | 最近一次主从交互之后的秒数 | 
| keyspace | 数据库中的key值总数 | 
持久性指标: Persistence
| Name | Description | 
|---|---|
| rdb_last_save_time | 最后一次持久化保存磁盘的时间戳 | 
| rdb_changes_sice_last_save | 自最后一次持久化以来数据库的更改数 | 
错误指标:Error
| Name | Description | 
|---|---|
| rejected_connections | 由于达到maxclient限制而被拒绝的连接数 | 
| keyspace_misses | key值查找失败(没有命中)次数 | 
| master_link_down_since_seconds | 主从断开的持续时间(以秒为单位) | 
监控方式
- redis-benchmark 
- redis-stat 
- redis-faina 
- redislive 
- redis-cli 
- monitor 
- showlog 
- 1)get:获取慢查询日志 
- 2)len:获取慢查询日志条目数 
- 3)reset:重置慢查询日志 
相关配置:
slowlog-log-slower-than 1000 # 设置慢查询的时间下线,单位:微秒slowlog-max-len 100 # 设置慢查询命令对应的日志显示长度,单位:命令数
- info(可以一次性获取所有的信息,也可以按块获取信息) 
- 1)server:服务器运行的环境参数 
- 2)clients:客户端相关信息 
- 3)memory:服务器运行内存统计数据 
- 4)persistence:持久化信息 
- 5)stats:通用统计数据 
- 6)Replication:主从复制相关信息 
- 7)CPU:CPU使用情况 
- 8)cluster:集群信息 
- 9)Keypass:键值对统计数量信息 
终端info命令使用
- ./redis-cli info 按块获取信息 | grep 需要过滤的参数 
- ./redis-cli info stats | grep ops 
交互式info命令使用
./redis-cliinfo server
性能监控
redis-cli info | grep ops # 每秒操作数
内存监控
[]used_memory_human:2.99Mused_memory_rss_human:8.04Mused_memory_peak_human:7.77Mused_memory_lua_human:37.00K
由于BLPOP,BRPOP,or BRPOPLPUSH而备阻塞的客户端
[]blocked_clients:0
由于最大内存限制被移除的key的数量
[]evicted_keys:0
内存碎片率
[]mem_fragmentation_ratio:2.74
已使用内存
[]used_memory:3133624
基本活动指标
redis连接了多少客户端
通过观察其数量可以确认是否存在意料之外的连接。如果发现数量不对劲,就可以使用lcient list指令列出所有的客户端链接地址来确定源头。
[]connected_clients:1[]connected_clients:1connected_slaves:1
持久性指标
[]rdb_last_save_time:1591876204[]rdb_changes_since_last_save:0
错误指标
由于超出最大连接数限制而被拒绝的客户端连接次数,如果这个数字很大,则意味着服务器的最大连接数设置得过低,需要调整maxclients
[]connected_clients:1
key值查找失败(没有命中)次数,出现多次可能是被hei ke gongjji
[]keyspace_misses:0
主从断开的持续时间(以秒为单位)
[]rdb_changes_since_last_save:0
复制积压缓冲区如果设置得太小,会导致里面的指令被覆盖掉找不到偏移量,从而触发全量同步
[]repl_backlog_size:1048576
通过查看sync_partial_err变量的次数来决定是否需要扩大积压缓冲区,它表示主从半同步复制失败的次数
[]sync_partial_err:1
redis性能测试命令
./redis-benchmark -c 100 -n 5000说明:100个连接,5000次请求对应的性能。
- END -
推荐阅读 Kubernetes 企业容器云平台运维实战 Linux运维工程师的 6 类好习惯和 23 个教训 一名运维小哥对运维规则的10个总结,收藏起来 NoOps 来了,DevOps 工程师的未来在何方? 终于明白了 DevOps 与 SRE 的区别! 我的云服务器被植入挖矿木马,CPU飙升200% Kubernetes上生产环境后,99%都会遇到这2个故障 如何用 Kubernetes 实现 CI/CD 发布流程?| 漫画 K8s kubectl 常用命令总结(建议收藏) Kubernetes 的这些核心资源原理,你一定要了解 我在创业公司的 “云原生” 之旅 基于Nginx实现灰度发布与AB测试 编写 Dockerfile 最佳实践 12年资深运维老司机的成长感悟 
点亮,服务器三年不宕机
评论


