欢迎光临散文网 会员登陆 & 注册

Infiniband OFED安装指南

2023-05-09 14:18 作者:雪域小白鸠  | 我要投稿

1、OFED工具

1.1、OFED工具介绍

NVIDIA OFED (MLNX_OFED) 是经 NVIDIA 测试和打包的 OFED 版本,支持使用相同 RDMA(远程 DMA)和称为 OFED verbs的内核绕过 API 的两种互连类型 — InfiniBand 和以太网。OFED 支持在 10/25/40/50/100/200GbE 上高达 200Gb/s InfiniBand 和 RoCE(基于 RDMA over Converged Ethernet 标准),使 OEM 和系统集成商能够满足上述终端用户的需求市场。

以下所有子工具都包含在OFED中,以下的所有操作都是基于设备安装OFED工具包

 

1.2、支持范围


  1、56GbE 是 NVIDIA 专有的链接速度,可以在将 NVIDIA 适配卡连接到 NVIDIA  SX10XX 交换机系列或将 NVIDIA 适配卡连接到另一个 NVIDIA 适配卡时实现。

  2、在强制模式和自动协商模式下支持 NRZ 和 PAM4 模式的速度。

  3、仅支持 PAM4 模式的速度。

 

1.3、下载工具

https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/  

映像名称的格式为 MLNX_OFED_LINUX-<ver>-<OS label><CPU arch>.iso。它可以从https://www.nvidia.com/en-us/networking/→ 产品→软件→ InfiniBand/VPI 驱动程序 → Mellanox OFED Linux (MLNX_OFED) 下载。

        ①向下滚动到下载向导,然后单击下载选项卡。

        ②根据您的主机操作系统选择您的相关软件包。

        ③单击所需的ISO/tgz包。

        ④要获取下载链接,请接受最终用户许可协议(EULA)


1.4、安装工具

①验证系统是否装了NVIDIA网卡适配器

命令示例:


②以root身份登录

③挂载下载完成的软件包(iso格式)

命令示例:

当然你也可以下载压缩包(tgz格式)进行解压

注:MLNX_OFED_LINUX-<ver>-<OS label>-<CPU arch>.iso为下载的软件包的镜像名。

MLNX_OFED_LINUX-<ver>-<OS label>-<CPU arch>.tgz为下载的软件包的压缩文件名。

 

④运行安装子程序

命令示例(注意,您解压在哪或挂载在哪儿,就去找那个目录下的mlnxofedinstall运行就行了,下面的代码都是只给您举个例子):

注:安装期间设备会多次询问,需要人为输入“Y”或“N”来确认,若不想设备询问,可添加静默安装参数。命令:/mnt/mlnxofedinstall --force

 

注:安装失败或者其他安装问题可以通过获取安装日志来确认问题所在,包含日志文件的目录路径,格式如下:

Logs dir: /tmp/MLNX_OFED_LINUX-4.4-1.0.0.0.IBMM2150110033.logs

 

1.5、安装失败-缺少必须的内核

在安装时,程序需要系统自带有某些内核支撑程序顺利安装,如果缺少相应的内核会安装程序会提示安装失败,并告知缺少的内核。安装好所需的内核后可继续执行安装程序。

(1)当前服务器已联网

①使用apt-get命令直接在线安装缺失的内核。

注:内核的名称,根据软件报错提示缺失的内核名称

命令示例:



(2)当前服务器未联网

①在网上下载需要的内核安装包,通常为.tar.gz格式。

②将下载的包复制到服务器中,以U盘为例。

1)、挂载U盘。 

 注:sdb1为U盘的盘符/分区号 

2)、将文件复制桌面

3)、解压缩文件

   注:解压缩后文件名基本以.deb格式为主。

4)、安装内核

1.6、安装失败-不支持当前内核

在安装时,可能会出现内核已变更,不再适用于当前下载系统版本对应的驱动包,那么解压系统包之后我们可以看到里面有一个mlnx_add_kernel_support.sh,那这个文件可以根据你现有的内核进行编译,然后重新打包驱动

在这里我举个例子,我下载的是centos7.5的OFED驱动,在/tmp/下解压的

驱动包名字为MLNX_OFED_LINUX-5.4-3.6.8.1-rhel7.5-x86_64


那么操作顺序依次是

(进入驱动目录)

(编译并将编译好的新驱动打包至/tmp目录下)

注意,如果编译提示你如下错误

那么请加入--skip-repo参数,像这样

编译完成后去/tmp/下找到编译好的压缩包

解压新压缩包

进新的解压的驱动

安装ofed驱动

安装完成之后会提示你

然后跟着绿色提示加载驱动

打完驱动输入ibstat或者ibstatus就会出现输出啦!


Infiniband OFED安装指南的评论 (共 条)

分享到微博请遵守国家法律