看 warning 信息可知,是缺少 nccl
在英伟达官网,根据自己的 cuda 选择对应的nccl,这里以cuda11.2为例,后面根据自己的 nccl2 和 cuda 版本修改相关命令
也可使用命令行下载
下载完成
安装镜像库
安装 nccl
将nccl添加到环境变量中