关注兔英伟达H100至尊版速度提10倍
关注兔靠着满屏的「生成式 AI」,手握一块支撑 ChatGPT 算力、提速 10 倍的 H100 NVLINK 芯片,老黄就差把这几个字写在脸上 ——「我是赢家」。
AI 的 iPhone 时刻已经到来,第四次科技革命就要开启,而手握 A100 和 H100 的英伟达,或成最大赢家。
在 GTC 大会上,老黄宣布了英伟达在 GPU、加速库、计算光刻、云平台上的亮眼进步,更是放出豪言 —— 英伟达就是要做 AI 圈的台积电!
现在已经有人猜测,今天的演讲都是在 H100 上用 AIGC 模型生成的。
ChatGPT 专用 GPU 已来
这次大会上最重磅的发布,就是针对 ChatGPT 打造的 NVIDIA H100 NVLINK。
因为算力需求巨大,针对 ChatGPT 等 LLM 的推理,英伟达推出了新款 Hopper GPU,配备双 GPU NVLINK 的 PCIE H100,具有 94B 内存。

事实上,深度学习的历史从 2012 年之后,就一直与英伟达息息相关。
老黄表示,2012 年深度学习元老 Hinton 和学生 Alex Kerchevsky、Ilya Suskever 在训练 AlexNet 时,用的正是 GeForce GTX 580。
随后,AlexNet 一举夺得 ImageNet 图像分类竞赛冠军,成为了深度学习大爆炸的奇点。
而时隔 10 年,在 OpenAI 的 Ilya Suskever 也是用着英伟达的 DGX,训练出了 ChatGPT 背后的 GPT3,及 GPT3.5。

老黄自豪地说,目前在云上唯一可以实际处理 ChatGPT 的 GPU,就是 HGX A100。
但与 A100 相比,一台搭载四对 H100 和双 GPU NVLINK 的服务器速度还要快上 10 倍!因为 H100 可以将 LLM 的处理成本降低一个数量级。
随着生成式 AI 掀起一波机遇浪潮,AI 正处于转折点,使得推理工作负载呈阶梯函数式增长。

在以前,设计一个云数据中心来处理生成式 AI,是巨大的挑战。
一方面,理想情况下最好使用一种加速器,使数据中心具有弹性;但另一方面,没有一个加速器能以最优的方式处理在算法、模型、数据类型和大小方面的多样性。英伟达的 One Architecture 平台就兼具加速功能和弹性。
而今天,英伟达宣布,推出全新的推理平台。每种配置都对某类工作负载进行了优化。

比如针对 AI 视频工作负载,英伟达就推出了 L4,在视频解码和转码、视频内容审核、视频通话功能上做了优化。

关注兔