欢迎光临散文网 会员登陆 & 注册

服务器配置----3090对应cuda和torch安装

2021-11-17 12:09 作者:Nofear-wave  | 我要投稿

多次尝试后发现3099仅支持cuda11.1以上的版本,对应torch也只能在cu111以上,否则运行会一直显示不兼容的问题。(因为这个走了很多弯路,反复下载又删掉cuda10,torch1.10.1cu102等,之后配置环境一定要结合服务器配置,做好准备工作!)

---发现上述问题之后,尝试cuda11.2+torch1.10.1cu113版本的组合,但这里由于网络问题,下载torch总是失败,多方查找解决方案,最终决定下在miniconda下配置环境。(之前一直知道conda配置环境大有优势,但偷懒没有下载,用了之后表示真香)!

废话有点多,大致把过程简单记录,以备不时之需。

首先关于miniconda安装和简单配置

wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh

chmod 777 Miniconda3-latest-Linux-x86_64.sh #给执行权限

bash Miniconda3-latest-Linux-x86_64.sh #运行

cd ./home/用户名/miniconda3/bin

chmod 777 activate

. ./activate #激活conda环境

conda config --add channels bioconda

conda config --add channels conda-forge #添加频道

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/  #这四条是添加channel

###下一步添加环境变量,否则conda不能运行!!(这个命令也是常见添加环境变量的命令)

vim ~/.bashrc

export PATH=$PATH:/home/用户名/miniconda3/bin  #根据实际路径确定

export PATH=$PATH:/home/user2/miniconda3/bin (这是我的命令)

source ~/.bashrc #保存更改

接下来安装cuda11.2

wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run

sudo sh cuda_11.2.0_460.27.04_linux.run #安装,具体弹出的设置参考网上教程

#接下来是添加环境变量

vim .bashrc

在末端添加如下(我可能写的有点多,但不敢乱删,卑微~)

export LD_LABRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.2/lib64

export PATH=$PATH:/usr/local/cuda-11.2/bin

export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.2

export PATH=/usr/local/cuda/bin:$PATH

在conda下创建torch1.10.-cu113的环境(下载很快,不会像pip命令下载很久)

conda create -n torch1.10 python=3.8

conda activate torch1.10 #进入虚拟环境

在torch官网找到对应版本,并将参考命令输入终端

 conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

最后测试一下是否可以

cd到st3目录,运行

python demo.py #未报错表示成功!(我自己设置的测试文件,查看cuda信息和能够运行将代码放到gpu上运行)

弱弱地说一句:忙活了好久终于先把gpu搭起来了,没有白干,坐在图书馆里要感动哭了!

大致搭建环境过程整理如上

接下来就需要进一步了解conda相应创建环境的指令以及复现st3代码

运行st3代码报错如下:

ninja: build stopped: subcommand failed. -明天的任务,解决它!!!


参考资源(参考过多,如有缺少请及时告知)

https://www.jianshu.com/p/edaa744ea47d

https://blog.csdn.net/weixin_43057279/article/details/113991780?utm_term=cuda11%E5%AE%89%E8%A3%85&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~sobaiduweb~default-1-113991780&spm=3001.4430

服务器配置----3090对应cuda和torch安装的评论 (共 条)

分享到微博请遵守国家法律