欢迎光临散文网 会员登陆 & 注册

搭建Slurm超直观仪表盘

2023-07-04 17:00 作者:雪域小白鸠  | 我要投稿

之前一直用的是slurm自带的sview,如下图所示

其实该有的都有,就是确实那啥(好丑,好难用)

最近我更新了Prometheus和Grafana的使用教程

想着slurm能不能也抓信息来瞅瞅,巧了,还真有

一 准备环境

请参考我之前的文章部署好Prometheus和Grafana,先学会用,熟能生巧

一定要先部署这俩Prometheus和Grafana!一定要先部署这俩!一定要先部署这俩!

这里将为大家以Centos7.9 minimal为基础环境作为演示

我的slurm管理节点是192.168.110.23


二 下载对应工具

首先我们要准备go安装包和slurm节点数据导出工具

需要一点小技巧去下载,这里给出连接,大家伙自己加油!

Go 

slurm节点导出工具

slurm dashbord json


三 编译安装

首先把这俩(json就放本地,不用传服务器),传到/home

解压

然后添加环境变量

然后在里面添加

保存退出后

然后我们就开始编译我们的slurm收集器啦

还是去home下解压我们的github项目

然后进去,准备编译

#########这里会有个小问题,GO会有组件在海外###########

#########这样的话就能正常下载那些组件啦##############

然后测试一下编译好没有

在prometheus-slurm-exporter-master目录下


测试通过后就可以直接开始信息收集啦

四 编辑Prometheus的yml文件

这里还是强调,更改很简单,但是请注意格式,空格缩进之类的,如图

这里我在bilibili老是对不齐,怕误导你们,就跟着图写吧

保存之后,重新启动普罗米修斯


五 去Grafana添加json

还是和上一篇文章一样,去Dashboard那里添加json

这里就不再讲了,忘了的话去看看上一篇吧!

添加完是酱紫

然后再去看Dashboard,等一会就有输出啦


搭建Slurm超直观仪表盘的评论 (共 条)

分享到微博请遵守国家法律