最流行的作业调度系统-Slurm安装 | 材料计算模拟软件@Linux服务器安装

Slurm是一个开源、容错、高度可扩展的集群管理和作业调度系统,适用于各种规模Linux集群。
Centos7的Linux系统安装过程举例:
1.安装前的配置:
- 安装epel源并生成数据缓存
yum install -y epel-release && yum makecache
- 安装GUI支持的GUI命令
yum groups install -y "Server with GUI"
- 重启服务器
- 修改主机名,这里改为slurm-master
hostnamectl set-hostname slurm-master
- 重启服务器
- 配置时间同步服务
~ 查看状态 systemctl status chronyd.service
~ 修改时间同步服务的配置文件
vi /etc/chrony.conf
将现有的四个同步服务进行注销(句首加#号),然后添加阿里云的时间同步。
server ntp.aliyun.com iburst
添加本机的ip地址
allow 192.168.xx.xx
保存退出。
~ 重新启动时间同步服务
systemctl restart chronyd.service
再查看服务状态,可以看到服务重新启动。
systemctl status chronyd.service
- 配置munge程序
安装munge程序
yum install -y munge munge-libs munge-devel
对munge程序文件权限进行调整(三条命令)
chmod -R 0700 /etc/munge /var/log/munge && chmod -R 0711 /var/lib/munge && chmod -R 0755 /var/run/munge
dd if=/dev/urandom bs=1 count=1024 >/etc/munge/munge.key
chown munge:munge /etc/munge/munge.key && chmod 0600 /etc/munge/munge.key
启动munge程序
systemctl start munge.service
查看程序状态
systemctl status munge.service
添加到自启动
systemctl enable munge.service
验证是否成功
munge -n | unmunge
2.部署slurm程序
- 安装依赖库
yum install -y rpm-build bzip2-devel openssl openssl-devel zlib-devel perl-DBI perl-ExtUtils-MakeMaker pam-devel readline-devel mariadb-devel python3 gtk2 gtk2-devel gcc make
- 创建slurm管理用户的配套用户
groupadd -g 200 slurm && useradd -u 200 -g 200 -s /sbin/noLogin -M slurm
- 转到根目录并下载slurm软件
cd & wget https://download.schedmd.com/slurm/slurm-20.11.9.tar.bz2
- 编译
rpmbuild -ta --clean slurm-20.11.9.tar.bz2
- 转到生成的rpm文件路径,并进行安装
cd rpmbuild/RPMS/x86_64/
ls
yum install -y slurm-*.rpm
- 修改slurm配置文件
cd /etc/slurm/
ls
cp slurm.conf.example slurm.conf
vi slurm.conf
做如下修改


- 启动slurm服务
systemctl start slurmd
systemctl restart slurmctld.service
systemctl status slurmctld.service
