监控系统 Grafana + Prometheus 之比 Docker 更简单的部署流程

2023-07-25 03:11 作者:承飞之咎 0人读过 | 我要投稿

若无单独说明，按照文章代码块中命令的顺序，一条一条执行，即可实现目标。
适用系统：Debian 系发行版，包括 Ubuntu ，其他发行版按流程稍改命令一般也可。

完成部署预计时间：15 分钟（但是看一遍也要 15 分钟，所以是 30分钟？）

文章里的一键脚本仅适用于 amd64 系统

Grafana，Prometheus 和 Node Exporter 是一套流行的开源监控工具，用于收集，存储，查询系统和应用程序的各种使用率，并可视化显示。每个工具都有特定的功能：

Grafana：是一款可视化程序，提供开源版和企业版。 Grafana 不从客户端收集任何数据，也不存储，它的功能是以直观且优美的格式显示 Prometheus 或其他数据源（SQL 等）收集的数据。它允许用户自定义面板，支持警报、注释、仪表板变量、插件和身份验证。
Prometheus：是一个开源的系统监控和警告程序，它使用 HTTP 协议轮询客户端以获取所需数据。维护结果的时间序列数据库，以预定义的时间间隔轮询每个客户端，进而能够构建客户端长期性能的概览。
Node Exporter：在客户端节点上能使用各种收集器，但 Prometheus 推荐使用自己的 Node Exporter 工具。它收集大量硬件和内核指标，如 CPU，磁盘 I/O，内存，网络等，收集的可用指标的完整列表可以在 Node Exporter GitHub page 页面上找到。

由于篇幅过长，更好的阅读体验，请移步博客： https://blog.vfly2.com/2023/07/a-simpler-deployment-process-of-the-probe-grafana-prometheus-compared-to-docker/

资源使用率

Grafana 和 Prometheus 部署好后，内存使用量增加了 200MB 多；监控的客户端为 3 个的情况下，在运行一天之后，内存占用达到 300MB 。总的来说，资源消耗量较大，适合 2g 内存、20GB 磁盘空间的机子作为监控服务器。

通过 top 命令，node_exporter 占用了大约 20 MB 内存。

部署流程

默认，Grafana Web 界面使用端口 3000 访问，而 Prometheus 使用端口 9090 ，Node Exporter 使用端口 9100 。开放防火墙：

为了获得最佳结果，请在同一服务器上运行 Prometheus 和 Grafana。下面将托管 Prometheus 和 Grafana 的服务器的系统称为“监控服务器”。被监控的系统是“客户端”。

本文中的步骤是为非 root 用户编写的。需要提升权限的命令以 sudo 为前缀。

在监控服务器上开放防火墙，已完成✔

如果不想使用脚本，或者希望了解安装过程，请查看原文： https://blog.vfly2.com/2023/07/a-simpler-deployment-process-of-the-probe-grafana-prometheus-compared-to-docker/ ，考虑篇幅过长，因此这么安排。

在监控服务器上安装 Prometheus 并作为服务运行

复制一键安装 Prometheus：（bash-script/install-prometheus.sh at main · AhFeil/bash-script (github.com)）

若运行结束后，出现 active (running) ，则安装成功。

通过 http://ip_addr:9090 访问 Prometheus Web 界面和仪表板。将 ip_addr 替换为监控服务器的地址。

在所有客户端上安装 Node Exporter，并开放防火墙。

客户端可以是 Linux 发行版，也可以是 Windows 等，不过 Node Exporter 仅适用于 Linux。

在客户端只给监控服务器IP 开放 9100 端口，记得修改监控服务器IP：

复制一键安装 Node Exporter：（bash-script/install-node_exporter.sh at main · AhFeil/bash-script (github.com)）

若运行结束后，出现 active (running) ，则安装成功。

更新的话重新运行一遍就可以

配置 Prometheus 来监控客户端

客户端节点现在已准备好进行监控。要将客户端添加到 prometheus.yml ，请按照以下步骤操作：

在运行Prometheus的监控服务器上，打开 prometheus.yml 进行编辑。

找到 scrape_configs ，里面是作业列表。当前有一个名为 prometheus 的作业。此作业监视端口 9090 上的本地 Prometheus 任务。

在 prometheus 作业下方，添加第二个作业，其 job_name 为 remote_collector 。包括以下信息。

设置抓取时间间隔： scrape_interval: 10s
添加要监控的 IP 和端口号 :9100 ，使用逗号分隔每个条目。
要启用对本地服务器的监视，请将 localhost:9100 条目添加到列表中，并在本地安装 Node Exporter。

该条目应类似于以下示例。将 remote_addr 替换为客户端的实际IP地址。

立即刷新 Prometheus，

使用 Web 浏览器重新访问监控服务器上端口 9090 的 Prometheus Web 门户。选择【Status】-【Targets】。将显示 remote_collector 作业的第二个链接，指向客户端上的端口 9100 。单击链接查看统计数据。

安装并部署 Grafana 服务器

Prometheus 收集的统计信息只能被视为原始数据转储。很难阅读，而且没有太大用处。

Grafana 提供了查看 Prometheus 收集的统计信息的界面。在运行 Prometheus 的同一服务器上安装 Grafana 并将 Prometheus 添加为数据源。

前置准备，

安装 Grafana 的开源版本。

重新加载 systemctl 守护进程。

加入开机自启，并立即启动

查看状态

关联 Grafana 和 Prometheus

所有系统组件现已安装，但 Grafana 和 Prometheus 尚未关联。剩下的可以使用 Grafana Web 界面完成。

要集成 Grafana 和 Prometheus，请按照以下步骤操作：

浏览器访问监控服务器的 3000 端口。例如，输入 http://ip_addr:3000 ，将 ip_addr 替换为实际 IP 地址。
Grafana 显示登录页面。使用用户名和默认密码都是 admin 。当出现提示时，将密码更改为更安全的值。
成功更改密码后，Grafana 将显示 Grafana 仪表板。
要将 Prometheus 添加为数据源，请单击齿轮符号（代表配置），然后选择数据源。

在下一个显示中，单击“添加数据源”按钮。
选择Prometheus作为数据源。
对于本地 Prometheus 源，将 URL 设置为 http://localhost:9090 。大多数其他设置可以保留默认值。

对设置满意后，选择屏幕底部的【Save & test】按钮。
如果所有设置均正确，Grafana 会确认 Data source is working 。

使用 Grafana ，导入仪表板模板

可以创建自定义仪表板。然而，Prometheus 已经创建了一个仪表板来支持 Node Exporter，名为 Node Exporter Full ，下面是导入的流程。

要创建自定义仪表板，请单击仪表板按钮，该按钮类似于四个正方形。然后选择+新建仪表板。有关更多信息，请参阅 Grafana 构建仪表板指南。

在 Grafana 仪表板。选择由四个正方形组成的仪表板图标，

右边【New】-【Import】。

然后在【Import via grafana.com】, 输入上一步中的 ID 1860 。然后选择【Load】。

在下一个屏幕确认导入详细信息。选择 Prometheus 作为数据源，然后单击【Import】按钮。

Node Exporter Full 仪表板立即生效。它显示客户端节点的性能指标和状态，包括内存、RAM 和 CPU 详细信息。

原文链接： https://blog.vfly2.com/2023/07/a-simpler-deployment-process-of-the-probe-grafana-prometheus-compared-to-docker/
版权声明：本博客所有文章除特別声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源承飞之咎 (blog.vfly2.com) 。

如果你认为我的文章有帮助，欢迎使用 RSS 订阅，也欢迎留言指正。

本文使用文章同步助手同步

标签：Linux Prometheus Grafana self-hosted