Infiniband OFED安装指南
1、OFED工具
1.1、OFED工具介绍
NVIDIA OFED (MLNX_OFED) 是经 NVIDIA 测试和打包的 OFED 版本,支持使用相同 RDMA(远程 DMA)和称为 OFED verbs的内核绕过 API 的两种互连类型 — InfiniBand 和以太网。OFED 支持在 10/25/40/50/100/200GbE 上高达 200Gb/s InfiniBand 和 RoCE(基于 RDMA over Converged Ethernet 标准),使 OEM 和系统集成商能够满足上述终端用户的需求市场。
以下所有子工具都包含在OFED中,以下的所有操作都是基于设备安装OFED工具包。
1.2、支持范围

1、56GbE 是 NVIDIA 专有的链接速度,可以在将 NVIDIA 适配卡连接到 NVIDIA SX10XX 交换机系列或将 NVIDIA 适配卡连接到另一个 NVIDIA 适配卡时实现。
2、在强制模式和自动协商模式下支持 NRZ 和 PAM4 模式的速度。
3、仅支持 PAM4 模式的速度。
1.3、下载工具
https://network.nvidia.com/products/infiniband-drivers/linux/mlnx_ofed/
映像名称的格式为 MLNX_OFED_LINUX-<ver>-<OS label><CPU arch>.iso。它可以从https://www.nvidia.com/en-us/networking/→ 产品→软件→ InfiniBand/VPI 驱动程序 → Mellanox OFED Linux (MLNX_OFED) 下载。
①向下滚动到下载向导,然后单击下载选项卡。
②根据您的主机操作系统选择您的相关软件包。
③单击所需的ISO/tgz包。
④要获取下载链接,请接受最终用户许可协议(EULA)。

1.4、安装工具
①验证系统是否装了NVIDIA网卡适配器
命令示例:
②以root身份登录
③挂载下载完成的软件包(iso格式)
命令示例:
当然你也可以下载压缩包(tgz格式)进行解压
注:MLNX_OFED_LINUX-<ver>-<OS label>-<CPU arch>.iso为下载的软件包的镜像名。
MLNX_OFED_LINUX-<ver>-<OS label>-<CPU arch>.tgz为下载的软件包的压缩文件名。
④运行安装子程序
命令示例(注意,您解压在哪或挂载在哪儿,就去找那个目录下的mlnxofedinstall运行就行了,下面的代码都是只给您举个例子):
注:安装期间设备会多次询问,需要人为输入“Y”或“N”来确认,若不想设备询问,可添加静默安装参数。命令:/mnt/mlnxofedinstall --force
注:安装失败或者其他安装问题可以通过获取安装日志来确认问题所在,包含日志文件的目录路径,格式如下:
Logs dir: /tmp/MLNX_OFED_LINUX-4.4-1.0.0.0.IBMM2150110033.logs
1.5、安装失败-缺少必须的内核
在安装时,程序需要系统自带有某些内核支撑程序顺利安装,如果缺少相应的内核会安装程序会提示安装失败,并告知缺少的内核。安装好所需的内核后可继续执行安装程序。
(1)当前服务器已联网
①使用apt-get命令直接在线安装缺失的内核。
注:内核的名称,根据软件报错提示缺失的内核名称
命令示例:
(2)当前服务器未联网
①在网上下载需要的内核安装包,通常为.tar.gz格式。
②将下载的包复制到服务器中,以U盘为例。
1)、挂载U盘。
注:sdb1为U盘的盘符/分区号
2)、将文件复制桌面
3)、解压缩文件
注:解压缩后文件名基本以.deb格式为主。
4)、安装内核
1.6、安装失败-不支持当前内核
在安装时,可能会出现内核已变更,不再适用于当前下载系统版本对应的驱动包,那么解压系统包之后我们可以看到里面有一个mlnx_add_kernel_support.sh,那这个文件可以根据你现有的内核进行编译,然后重新打包驱动
在这里我举个例子,我下载的是centos7.5的OFED驱动,在/tmp/下解压的
驱动包名字为MLNX_OFED_LINUX-5.4-3.6.8.1-rhel7.5-x86_64
那么操作顺序依次是
(进入驱动目录)
(编译并将编译好的新驱动打包至/tmp目录下)
注意,如果编译提示你如下错误
那么请加入--skip-repo参数,像这样
编译完成后去/tmp/下找到编译好的压缩包
解压新压缩包
进新的解压的驱动
安装ofed驱动
安装完成之后会提示你
然后跟着绿色提示加载驱动
打完驱动输入ibstat或者ibstatus就会出现输出啦!