欢迎光临散文网 会员登陆 & 注册

【day1】炼丹第一步:割肉买显卡(5张P40)

2023-05-03 19:21 作者:pzqking  | 我要投稿

这条评论,拿图灵架构以前的矩阵核心怼我之前,先回答:

1.在tf或torch里,如何开启混合精度计算?(这是最主流的两个深度学习包,如果你是百度的,也可以加个飞桨,当然也包括周边的一些辅助性三方包,比如scify,torchvision之类的)

2.显存对于深度学习的意义

3.什么是ECC

4.买两张10G显存的卡,能不能在CUDA接口中识别为单张20G显存的卡?如果需要别的办法,请注明。

如果你的目标是训练或科研,建议不要受前面矩阵核心评论的干扰,这样配很好。

首先,无脑下FP16的后果他们很可能不知道,模型打死不收敛,到后面算loss的时候,你会看着一堆的NAN一脸懵。

确实很“快”,但是结果算不对的快又有什么意义呢?

这就是为什么图灵架构及以前的一些“矩阵核心”的卡看起来性价比很高,实际上也就V100比较主流,最大的原因还是V100这玩意双精度能到7T,16G原装拆机卡大概也就4k这样,保一年含税。

不然你看看图灵架构,除了T4,基本都被开除NV籍了,T10/T40仅供云游戏服务器。

如果想要用矩阵核心加速单精度,你必须使用安培架构以上的卡,安培架构24G至少3090,也是老矿骨之一。

比单精度,不好意思,P40这单精度已经有11T以上了,跟2080一个水准。如果单精度还是不行,这边建议直接入MI50,拿双精度算。

至于推荐2080ti改22G显存,你帮UP改好,保修至少一年,知道吗,至少一年,你能做到这一点你再来怼我的评论。事实上,正经服务器买卡开头都是保三年。但就是这种个人炼丹炉,你也不能骗一波就跑,改装就是没有原装稳。人家P40还带原生的ECC呢,这点怎么顶?

稳定性一个天上一个地下。

五张1200那就是6k,这个价位真没什么好选的,就P40,没错的。我这两个月订显卡,含税也这个价,就是正经P40。如果还爆NAN就收几张MI50或者P100,也可以一张V100。

最后,我教你怎么改。板子找能塞5张双槽的板,不好找,但四张的好找,华擎X399太极,华硕X399ZE都可以。

按顺序把四张卡前胸贴后背插上去,接好供电。

然后每两张卡收两个10cm的暴力扇(五千转都用不到,看情况,买小4p能调速的),你会发现这玩意会很完美地贴合的了前一张卡的防尘罩前端和后一张卡的PCB背板。

就你想的这样,直接胶枪伺候,一个扇子粘在机箱内端,另一个粘在机箱外面,注意两个扇子的风道方向相同就行。

接下来装好其他东西,进bios,有些板子的sysfan不会自动上电,要手动开,把转速调到你能接受的范围。

进系统,装CUDA,配环境,跑程序,观察温度。如果一直撞在90度,就调大风扇转速,5K转还压不住就找老板换卡。如果一直五六十度(我之前压两张300W的K80,两千多转就这个成绩了,这玩意才250W一张),就往下拉转速,满载温度在80度左右是最好的。

这样,这台机子就完成了,如果你有闲心情,可以想方设法找帕斯卡这一代的NVLINK(注意,必须是P40或P100/GP100用的,有区别,游戏卡的NVLINK不桥显存),极其稀有,但如果能一两百收到,你将获得一套神机,但没有也没关系,凑合凑合也能用。

【day1】炼丹第一步:割肉买显卡(5张P40)的评论 (共 条)

分享到微博请遵守国家法律