关注兔英伟达H100至尊版速度提10倍

2023-03-22 18:54 作者:靛酊嬭翊 0人读过 | 我要投稿

关注兔靠着满屏的「生成式 AI」，手握一块支撑 ChatGPT 算力、提速 10 倍的 H100 NVLINK 芯片，老黄就差把这几个字写在脸上 ——「我是赢家」。

AI 的 iPhone 时刻已经到来，第四次科技革命就要开启，而手握 A100 和 H100 的英伟达，或成最大赢家。

在 GTC 大会上，老黄宣布了英伟达在 GPU、加速库、计算光刻、云平台上的亮眼进步，更是放出豪言 —— 英伟达就是要做 AI 圈的台积电！

现在已经有人猜测，今天的演讲都是在 H100 上用 AIGC 模型生成的。

ChatGPT 专用 GPU 已来

这次大会上最重磅的发布，就是针对 ChatGPT 打造的 NVIDIA H100 NVLINK。

因为算力需求巨大，针对 ChatGPT 等 LLM 的推理，英伟达推出了新款 Hopper GPU，配备双 GPU NVLINK 的 PCIE H100，具有 94B 内存。

事实上，深度学习的历史从 2012 年之后，就一直与英伟达息息相关。

老黄表示，2012 年深度学习元老 Hinton 和学生 Alex Kerchevsky、Ilya Suskever 在训练 AlexNet 时，用的正是 GeForce GTX 580。

随后，AlexNet 一举夺得 ImageNet 图像分类竞赛冠军，成为了深度学习大爆炸的奇点。

而时隔 10 年，在 OpenAI 的 Ilya Suskever 也是用着英伟达的 DGX，训练出了 ChatGPT 背后的 GPT3，及 GPT3.5。

老黄自豪地说，目前在云上唯一可以实际处理 ChatGPT 的 GPU，就是 HGX A100。

但与 A100 相比，一台搭载四对 H100 和双 GPU NVLINK 的服务器速度还要快上 10 倍！因为 H100 可以将 LLM 的处理成本降低一个数量级。

随着生成式 AI 掀起一波机遇浪潮，AI 正处于转折点，使得推理工作负载呈阶梯函数式增长。

在以前，设计一个云数据中心来处理生成式 AI，是巨大的挑战。

一方面，理想情况下最好使用一种加速器，使数据中心具有弹性；但另一方面，没有一个加速器能以最优的方式处理在算法、模型、数据类型和大小方面的多样性。英伟达的 One Architecture 平台就兼具加速功能和弹性。

而今天，英伟达宣布，推出全新的推理平台。每种配置都对某类工作负载进行了优化。

比如针对 AI 视频工作负载，英伟达就推出了 L4，在视频解码和转码、视频内容审核、视频通话功能上做了优化。

关注兔

标签：

关注兔英伟达H100至尊版速度提10倍的评论 (共条)