搭建Slurm超直观仪表盘

之前一直用的是slurm自带的sview,如下图所示

其实该有的都有,就是确实那啥(好丑,好难用)
最近我更新了Prometheus和Grafana的使用教程
想着slurm能不能也抓信息来瞅瞅,巧了,还真有


一 准备环境
请参考我之前的文章部署好Prometheus和Grafana,先学会用,熟能生巧
一定要先部署这俩Prometheus和Grafana!一定要先部署这俩!一定要先部署这俩!
这里将为大家以Centos7.9 minimal为基础环境作为演示
我的slurm管理节点是192.168.110.23
二 下载对应工具
首先我们要准备go安装包和slurm节点数据导出工具
需要一点小技巧去下载,这里给出连接,大家伙自己加油!
Go
slurm节点导出工具
slurm dashbord json
三 编译安装
首先把这俩(json就放本地,不用传服务器),传到/home下
解压
然后添加环境变量
然后在里面添加

保存退出后
然后我们就开始编译我们的slurm收集器啦
还是去home下解压我们的github项目
然后进去,准备编译
#########这里会有个小问题,GO会有组件在海外###########
#########这样的话就能正常下载那些组件啦##############
然后测试一下编译好没有
在prometheus-slurm-exporter-master目录下

测试通过后就可以直接开始信息收集啦

四 编辑Prometheus的yml文件
这里还是强调,更改很简单,但是请注意格式,空格缩进之类的,如图
这里我在bilibili老是对不齐,怕误导你们,就跟着图写吧


保存之后,重新启动普罗米修斯
五 去Grafana添加json
还是和上一篇文章一样,去Dashboard那里添加json

这里就不再讲了,忘了的话去看看上一篇吧!
添加完是酱紫

然后再去看Dashboard,等一会就有输出啦
