5倍性能提升!A100超强加速
一、环境配置
本次训练采用的是经典的LeNet网络,实现手写数字识别任务,选取的两个对照服务器均为炼丹侠A100服务器。
首先通过tabby连接炼丹侠A100云服务器,之后安装对应的环境,本次采用的环境为cuda11.7+python3.8+pytorch/torchaudio/torchvision(cuda11.7对应版本),训练代码在下方网址内:https://blog.csdn.net/eroDuanDian123456/article/details/125665521
二、训练优化
原代码只做了cpu上训练的部分,作为对照,在原代码基础上将网络结果,数据等内容全部移到了GPU上,使A100能充分应用到代码训练加速中,修改后的代码如下
三、训练过程

四、运行结果
CPU版本训练总共耗时152秒

炼丹侠A100加速版本训练总共耗时33秒
