欢迎光临散文网 会员登陆 & 注册

5倍性能提升!A100超强加速

2023-08-02 11:15 作者:炼丹侠  | 我要投稿

一、环境配置

本次训练采用的是经典的LeNet网络,实现手写数字识别任务,选取的两个对照服务器均为炼丹侠A100服务器。

首先通过tabby连接炼丹侠A100云服务器,之后安装对应的环境,本次采用的环境为cuda11.7+python3.8+pytorch/torchaudio/torchvision(cuda11.7对应版本),训练代码在下方网址内:https://blog.csdn.net/eroDuanDian123456/article/details/125665521

二、训练优化

原代码只做了cpu上训练的部分,作为对照,在原代码基础上将网络结果,数据等内容全部移到了GPU上,使A100能充分应用到代码训练加速中,修改后的代码如下

三、训练过程

四、运行结果

CPU版本训练总共耗时152秒

CPU版本训练总共耗时152秒

炼丹侠A100加速版本训练总共耗时33秒

炼丹侠A100加速版本训练总共耗时33秒


5倍性能提升!A100超强加速的评论 (共 条)

分享到微博请遵守国家法律