欢迎光临散文网 会员登陆 & 注册

2023.3.21

2023-03-22 16:05 作者:tanis2012  | 我要投稿

用A4000跑了nanogpt的shakespeare的例子

先说性能   windows下1iter是5500ms左右,在ubuntu下的compile模式,提升到2300ms左右,pytorch2.0这波compile模式的更新非常可以。

然后费了很大劲终于把那个12g的openwebtext数据集搞下来了,但是在a4000显卡上,显示显存不够,跑不了。只能等4090了


下午装上了4090 

终于能跑gpt2的小模型了,跑的时候,功耗490w。速度如上图,上图mfu的指标是指速度和a100的比例,这个图可以看出来速度是A100的29%。果然是一分钱一分货。


2023.3.21的评论 (共 条)

分享到微博请遵守国家法律