解决 Grafana Node_exporter 网卡流量监控不准确

云原生实验室

共 1347字,需浏览 3分钟

 ·

2022-02-27 10:14


最近服务器添加监控和报警后,发现服务器网卡流量监控不准确。因为我服务本身就 10M 带宽,但是这里的上行和下行带宽竟然高达 30M。这里的模板我使用的是大家用的比较多的8919模板

问题分析

首先我这里将 grafana 的出图语句复制下来进行分析

我们复制监控项的语句到 Prometheus 上进行查看

我没有添加任何规则,发现获取的网卡流量包含dockerlo以及eth的流量

解决问题

发现了问题后,我们需要修改一下语句,将 docker 网卡以及 lo 或者其它本地流量的网卡进行过滤(node_network_receive_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'} )

过滤完成后,修改 grafana 语句

  • 上传语句
max(rate(node_network_transmit_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'}[$interval])) by (instance)
  • 下载语句
max(rate(node_network_receive_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'} [$interval])) by (instance)

修改完成后,我们发现监控的值是没有问题了,连接数和上行下行带宽也对的上,这个之前我也测试过了。

这些改完实际上到此为止是已经结束了,但是我发现还有一个问题,就是本来 grafana 模板给的是 30M 图标变黄,1000M 进行告警。但是目前我本地服务器的网络大部分是处于 5-10M 之间。也就是基本上跑满我带宽,grafana 出图也不会告警。接下来我们就来修改 grafana 颜色变更阈值

右边下滑到最下面,这里监控的单位是字节,也就是我们要设置 3M-10M 之间的字节

修改

换算单位

3 M=3145728 字节10M =10485760 字节

将下面 grafana 出图单位改成3145728,10485760

我这里将上下行都改成这个,具体按照实际情况进行修改

接下来点击Apply更新

查看

目前来看已经恢复正常,左边为宝塔控制面板的网络监控,属于实时监控。右边为 grafana 出图监控,因为 node_exporter 属于静态监控,不能算是实时更新,受网络上报的影响。大小差距不大

原文链接:https://i4t.com/5284.html


你可能还喜欢

点击下方图片即可阅读

Crossplane - 比 Terraform 更先进的云基础架构管理平台?

云原生是一种信仰 🤘

关注公众号

后台回复◉k8s◉获取史上最方便快捷的 Kubernetes 高可用部署工具,只需一条命令,连 ssh 都不需要!



点击 "阅读原文" 获取更好的阅读体验!


发现朋友圈变“安静”了吗?

浏览 130
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报