欢迎光临散文网 会员登陆 & 注册

最流行的作业调度系统-Slurm安装 | 材料计算模拟软件@Linux服务器安装

2023-07-11 22:09 作者:山阳の云台  | 我要投稿

Slurm是一个开源、容错、高度可扩展的集群管理和作业调度系统,适用于各种规模Linux集群。

Centos7的Linux系统安装过程举例:

1.安装前的配置:

  • 安装epel源并生成数据缓存

yum install -y epel-release && yum makecache

  • 安装GUI支持的GUI命令

yum groups install -y "Server with GUI"

  • 重启服务器
  • 修改主机名,这里改为slurm-master

hostnamectl set-hostname slurm-master 

  • 重启服务器
  • 配置时间同步服务

~ 查看状态 systemctl status chronyd.service

~ 修改时间同步服务的配置文件

vi /etc/chrony.conf

将现有的四个同步服务进行注销(句首加#号),然后添加阿里云的时间同步。

server ntp.aliyun.com iburst

添加本机的ip地址

allow 192.168.xx.xx

保存退出。

~ 重新启动时间同步服务

systemctl restart chronyd.service

再查看服务状态,可以看到服务重新启动。

systemctl status chronyd.service

  • 配置munge程序

安装munge程序

yum install -y munge munge-libs munge-devel

对munge程序文件权限进行调整(三条命令)

chmod -R 0700 /etc/munge /var/log/munge && chmod -R 0711 /var/lib/munge && chmod -R 0755 /var/run/munge 

dd if=/dev/urandom bs=1 count=1024 >/etc/munge/munge.key

chown munge:munge /etc/munge/munge.key && chmod 0600 /etc/munge/munge.key

启动munge程序

systemctl start munge.service

查看程序状态

systemctl status munge.service

添加到自启动

systemctl enable munge.service

验证是否成功

munge -n | unmunge


2.部署slurm程序

  • 安装依赖库

yum install -y rpm-build bzip2-devel openssl openssl-devel zlib-devel perl-DBI perl-ExtUtils-MakeMaker pam-devel readline-devel mariadb-devel python3 gtk2 gtk2-devel gcc make

  • 创建slurm管理用户的配套用户

groupadd -g 200 slurm && useradd -u 200 -g 200 -s /sbin/noLogin -M slurm 

  • 转到根目录并下载slurm软件

cd & wget https://download.schedmd.com/slurm/slurm-20.11.9.tar.bz2

  • 编译

rpmbuild -ta --clean slurm-20.11.9.tar.bz2

  • 转到生成的rpm文件路径,并进行安装

cd rpmbuild/RPMS/x86_64/

ls

yum install -y slurm-*.rpm

  • 修改slurm配置文件

cd /etc/slurm/

ls

cp slurm.conf.example slurm.conf

vi slurm.conf

做如下修改

  • 启动slurm服务

systemctl start slurmd

systemctl restart slurmctld.service

systemctl status slurmctld.service












最流行的作业调度系统-Slurm安装 | 材料计算模拟软件@Linux服务器安装的评论 (共 条)

分享到微博请遵守国家法律