Prometheus 监控系统入门学习

共 3501字，需浏览 8分钟

·

2021-11-27 07:42

学习目标

能够安装prometheus服务器

能够通过安装node_exporter监控远程linux

能够通过安装mysqld_exporter监控远程mysql数据库

能够安装grafana

能够在grafana添加prometheus数据源

能够在grafana添加监控cpu负载的图形

能够在grafana图形显示mysql监控数据

能够通过grafana+onealert实现报警

任务背景

某某某公司是一家电商网站，由于公司的业务快速发展，公司要求对现有机器进行业务监控，责成运维部门来实施这个项目。

任务要求

1）部署监控服务器，实现7x24实时监控

2）针对公司的业务及研发部门设计监控系统，对监控项和触发器拿出合理意见

3）做好问题预警机制，对可能出现的问题要及时告警并形成严格的处理机制

4）做好监控告警系统，要求可以实现告警分级

一级报警电话通知

二级报警微信通知

三级报警邮件通知

5）处理好公司服务器异地集中监控问题，K8S内部使用的监控系统就是普罗米修斯

任务分析

为什么要监控？

答: 实时收集数据，通过报警及时发现问题，及时处理。数据为优化也可以提供依据。

监控四要素：

监控对象 [主机状态服务资源页面，url]

用什么监控 [zabbix-server zabbix-agent] => 普罗米修斯监控

什么时间监控 [7x24 5x8]

报警给谁 [管理员]

一、Prometheus概述

Prometheus(由go语言(golang)开发)是一套开源的监控&报警&时间序列数据库的组合。适合监控docker容器。因为kubernetes(俗称k8s)的流行带动了prometheus的发展。

https://prometheus.io/docs/introduction/overview/

二、时间序列数据

1、什么是序列数据

时间序列数据(TimeSeries Data) : 按照时间顺序记录系统、设备状态变化的数据被称为时序数据。

应用的场景很多, 如：

无人驾驶车辆运行中要记录的经度，纬度，速度，方向，旁边物体的距离等等。每时每刻都要将数据记录下来做分析。
某一个地区的各车辆的行驶轨迹数据
传统证券行业实时交易数据
实时运维监控数据等

2、时间序列数据特点

性能好

关系型数据库对于大规模数据的处理性能糟糕。NOSQL可以比较好的处理大规模数据，让依然比不上时间序列数据库。

存储成本低

高效的压缩算法，节省存储空间，有效降低IO

Prometheus有着非常高效的时间序列数据存储方法，每个采样数据仅仅占用3.5byte左右空间，上百万条时间序列，30秒间隔，保留60天，大概花了200多G（来自官方数据)

3、Prometheus的主要特征

多维度数据模型
灵活的查询语言
不依赖分布式存储，单个服务器节点是自主的
以HTTP方式，通过pull模型拉去时间序列数据
也可以通过中间网关支持push模型
通过服务发现或者静态配置，来发现目标服务对象
支持多种多样的图表和界面展示

4、普罗米修斯原理架构图

三、实验环境准备

1. 静态ip(要求能上外网)

2. 主机名

3. 时间同步(时间同步一定要确认一下)

4. 关闭防火墙,selinux

1、安装prometheus

从 https://prometheus.io/download/ 下载相应版本，安装到服务器上

官网提供的是二进制版，解压就能用，不需要编译

2、prometheus界面

通过浏览器访问http://服务器IP:9090就可以访问到prometheus的主界面

默认只监控了本机一台，点Status --》点Targets --》可以看到只监控了本机

3、主机数据展示

通过http://服务器IP:9090/metrics可以查看到监控的数据

在web主界面可以通过关键字查询监控项

4、监控远程Linux主机

① 在远程linux主机(被监控端agent1)上安装node_exporter组件

下载地址: https://prometheus.io/download/

扩展: nohup命令: 如果把启动node_exporter的终端给关闭,那么进程也会随之关闭。nohup命令会帮你解决这个问题。

② 通过浏览器访问http://被监控端IP:9100/metrics就可以查看到node_exporter在被监控端收集的监控信息

③ 回到prometheus服务器的配置文件里添加被监控机器的配置段

④ 回到web管理界面 --》点Status --》点Targets --》可以看到多了一台监控目标

练习: 加上本机prometheus的监控

答: 在本机安装node_exporter，也使用上面的方式监控起来。

5、监控远程MySQL

① 在被管理机agent1上安装mysqld_exporter组件

下载地址: https://prometheus.io/download/

② 回到prometheus服务器的配置文件里添加被监控的mariadb的配置段

③ 回到web管理界面 --》点Status --》点Targets --》可以看到监控mariadb了

四、Grafana可视化图形工具

1、什么是Grafana

Grafana是一个开源的度量分析和可视化工具，可以通过将采集的数据分析，查询，然后进行可视化的展示,并能实现报警。

网址: https://grafana.com/

2、使用Grafana连接Prometheus

① 在grafana服务器上安装grafana

下载地址:https://grafana.com/grafana/download

② 通过浏览器访问 http:// grafana服务器IP:3000就到了登录界面,使用默认的admin用户,admin密码就可以登陆了

③ 下面我们把prometheus服务器收集的数据做为一个数据源添加到grafana,让grafana可以得到prometheus的数据。

④ 然后为添加好的数据源做图形显示

⑤ 保存

⑥ 最后在dashboard可以查看到

⑦ 匹配条件显示

3、Grafana图形显示MySQL监控数据

① 在grafana上修改配置文件,并下载安装mysql监控的dashboard（包含相关json文件，这些json文件可以看作是开发人员开发的一个监控模板)

参考网址: https://github.com/percona/grafana-dashboards

② 在grafana图形界面导入相关json文件

③ 点import导入后,报prometheus数据源找不到,因为这些json文件里默认要找的就是叫Prometheus的数据源，但我们前面建立的数据源却是叫prometheus_data(坑啊)

那么请自行把原来的prometheus_data源改名为Prometheus即可(注意:第一个字母P是大写)

然后再回去刷新,就有数据了(如下图所示)

④ 过段时间再看，就会有数据了(如下图所示)

4、Grafana+onealert报警

prometheus报警需要使用alertmanager这个组件，而且报警规则需要手动编写(对运维来说不友好)。所以我这里选用grafana+onealert报警。

注意: 实现报警前把所有机器时间同步再检查一遍.

① 先在onealert里添加grafana应用(申请onealert账号在zabbix已经讲过)

② 配置通知策略

③ 在grafana增加通知通道

④ 现在可以去设置一个报警来测试了(这里以我们前面加的cpu负载监控来做测试)

⑤ 保存后就可以测试了

如果agent1上的cpu负载还没有到0.5，你可以试试0.1,或者运行一些程序把agent1负载调大。最终能测试报警成功。

最终的邮件报警效果：

测试mysql链接数报警

5、总结报警不成功的可能原因

各服务器之间时间不同步，这样时序数据会出问题，也会造成报警出问题
必须写通知内容，留空内容是不会发报警的
修改完报警配置后，记得要点右上角的保存
保存配置后，需要由OK状态变为alerting状态才会报警(也就是说，你
配置保存后，就已经是alerting状态是不会报警的)
grafana与onealert通信有问题

来自twt社区会员分享，版权归原作者所有

Linux学习指南
有收获，点个在看 

浏览 55

点赞

收藏

分享

举报

评论

图片

表情

Prometheus服务监控系统

Prometheus是一个开源的服务监控系统和时间序列数据库。特性：高维度数据模型自定义查询语言可视化数据展示高效的存储策略易于运维提供各种客户端开发库警告和报警数据导出

Prometheus服务监控系统

Prometheus 是一个开源的服务监控系统和时间序列数据库。特性：高维度数据模型自定义查询语言可

实战 Prometheus 搭建监控系统

杰哥的IT之旅

实战 Prometheus 搭建监控系统

浪尖聊大数据

实战 Prometheus 搭建监控系统

Prometheus 监控系统，它有多强！

杰哥的IT之旅

实战 Prometheus 搭建监控系统

JAVA葵花宝典

主流监控系统 Prometheus 学习指南

DevOps技术栈

主流监控系统 Prometheus 学习指南

程序员面试吧

Prometheus Grafana 搭建监控系统