这是史上最快GPU!我们测了四张H100!价值120万元!

大家好,视频中分子动力学部分是我负责测试的,如果对此感兴趣,可以去我主页或者计算化学公社仔细阅读我发的网络文章。
有人质疑LAMMPS测试用的没有双精度,我可以明确地说,测试用的加速包是当前有在积极维护的Kokkos,这个加速包目前还不支持单精度/混合精度,不久的将来也许会支持(LAMMPS开发者说的)。
视频里没有放多卡并行跑MD的数据,主要是因为测试所用的平台不知为何默认没有启用P2P,导致多卡并行效率极低(P2P是一种绕过CPU内存,让GPU之间直接通信的机制,对计算卡来说没有插NVLink桥也可以用PCIe P2P,而GeForce卡不行)。实际上,这也是视频中训练AI模型相关测试的并行效率差的主要原因之一。
简单来说,这次测试没有发挥出计算卡的与游戏卡的主要区别之一——扩展性,这是计算卡溢价的主要因素。