超越4090一万倍！英伟达的GPU强大到让人害怕

2023-08-11 17:09 作者:科研市 0人读过 | 我要投稿

从最开始的AI绘图到如今的语言大模型、chatGPT等等，AI人工智能已经是各大互联网企业的新发展方向。借着AI浪潮，英伟达也顺利成为新兴行业的领军人物。近两年英伟达凭借着数据中心业务，从一家开发游戏硬件的企业变成了全球最大的算力供应商。今年英伟达也召开了多场发布会，但黄仁勋提到最多的不是游戏，而是生成式AI、数据中心、加速计算等新名词。

数据中心业务崛起并不代表英伟达放弃了游戏业务。目前英伟达的RTX 4090依然是顶级消费级GPU显卡，性能远超AMD和英特尔，而英伟达占据了80%以上游戏市场份额，游戏玩家的首选显卡依然是NVIDA。

笔者了解到，英伟达当前市值已突破1.1万亿，全球第一家市值突破万亿美元的芯片公司，也是当前市值仅次于苹果、微软、Alphabet、亚马逊的美股第五大科技股。

英伟达的计算卡已经成为衡量企业实力的标准之一，谁拥有NVIDA的计算卡越多，证明这家企业算力越强，开发资源就丰富，潜力越大。

例如我们所熟知的微软、Meta、亚马逊、腾讯、网易等互联网大厂都在争抢英伟达的H100、A100、A800等计算卡。

因为英伟达的产品性能过于强大，导致美国政府推出限制出口政策，当年国内市场已经出现一卡难求，部分显卡价格疯涨。

针对庞大的市场需求，英伟达已经加大产能，并且持续更新换代产品。今年5月的台北电脑展上，英伟达展示了用256个GH200 Grace Hopper超级芯片组成的超级计算机DGX GH200。DGX GH200人工智能超级计算平台所提供的AI算力是RTX 4090的一万倍！

笔者了解到， Grace Hopper超级芯片已经全面投产，这是DGX GH200超算平台和MGX系统的核心组件，专为处理海量的生成型人工智能任务而设计。

Grace Hopper 超级芯片是英伟达开发的基于Arm架构的CPU+GPU集成方案，将72核的Grace CPU、Hopper GPU、96GB的HBM3和512GB的LPDDR5X集成在同一个封装中，共有 2000亿个晶体管。这种组合提供了CPU和GPU之间惊人的数据带宽，高达1TB/S，为某些内存受限的工作负载提供了强大的性能。

目前最新的DGX GH200超算平台搭载HBM3e内存，内存容量从每个GPU96GB扩展到144GB，增加了50%。笔者了解到，HBM3e内存是一种新型的高带宽内存技术，在运算速度上HBM3e能比HBM3运算速度快50%，提供最高5TB/秒的传输速率。新内存让新GH200运行AI模型的速度提高了3.5倍。

DGX GH200超算平台内存能达到282GB，相比上代产品，容量增加了3.5倍，带宽增加了3倍。GH200还支持英伟达的NVLink，可以根据企业的需求组合成不同规模的形态，单卡、双卡、多卡服务器、机柜，甚至是超级计算机。

GH200可以组合成256张卡的DGX GH200SuperPod超级计算机，拥有144TB的快速内存，每秒可以执行10的18次方次浮点运算。如果单个DGX GH200超算平台还不能满足需求，英伟达还有专门的服务器机柜，官方人员会上门调试安装，一站式服务。总之，企业想要提升运算速度，只需要增加更多的服务器机柜就行。

按照官方说法，曾经1亿美元预算，只能建设一个小的数据中心，而且还需要购买800个×86GPU，耗费5兆瓦的电力。如果选择英伟达Grace Hopper计算方案，成本仅800万美元就能达到同等工作量。如果预算是1亿美元，选英伟达的Grace Hopper仅耗费3兆瓦的电力，而且数据吞吐量还能提高一个数量级。总之，同样的预算，英伟达的方案更省电，而且算力更高。而同样的算力，英伟达的成本更低。

笔者了解到，新款HBM3e内存的DGX GH200超算平台需要等到2024年的第二季度上市。而搭载普通HBM3内存的GH200按原计划在今年下半年正式发售。

针对个人开发者和小型企业，英伟达推出了新一代工作站显卡：RTX 5000、RTX 4500以及RTX 4000。RTX 5000采用了第4代Tensor Core和第3代RT Core，相比上一代GPU，单精度浮点运算性能提升了2倍，达到了90TFLOPS的峰值，配备高达32GB的GDDR6视频内存，支持ECC错误校验，适用于高端工作站、数据中心和云游戏。

RTX 4500配备24GB GDDR6视频内存，也支持ECC校验。光线追踪性能提升1倍，AI处理性能提升2倍，适合创意专业用户、小型工作站。RTX 4000是相同的GPU核心，配备20GB GDDR6视频内存，光线追踪和AI计算性能都有大幅提升。全新的RTX 5000已经发售，其余两款产品将在下半年陆续上市。

虽然AI的功能很强大，但部署AI大模型非常繁琐，门槛过高。为了降低门槛，英伟达将推出AI Workbench工具包。笔者了解到，AI Workbench提供配置AI模型所需框架、工具开发包等环境。开发人员能够在PC或工作站上快速创建、测试和自定义预训练的生成式AI模型，然后扩展到数据中心、公共云或NVIDIA DGX™云。

如果你想使用AI模型来绘图，但没有强大的硬件提供算力，也不懂如何部署模型，但有了AI Workbench，只需要选择一个4个RTX 6000云工作站，然后就能一键配置AI模型。如果对生成图片不满意，还可以自己上传图片，重新训练模型后再生成。

过去，由于硬件算力的限制，训练AI模型需要成千上万张A100显卡才能完成，不仅成本过高，而且难度也很大，效率较低。但现在有了DGX GH200，企业就不需要部署庞大的计算机集群，仅需要一套超算平台，就能完成工作任务。

笔者认为，英伟达的产品极大降低了AI行业门槛，无论你是个人，还是小微企业，只需要一个工具包，就能自己部署、训练AI模型，成功跨入AI时代。

标签：

超越4090一万倍！英伟达的GPU强大到让人害怕

超越4090一万倍！英伟达的GPU强大到让人害怕的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

超越4090一万倍！英伟达的GPU强大到让人害怕

本文作者的其他文章

超越4090一万倍！英伟达的GPU强大到让人害怕的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

超越4090一万倍！英伟达的GPU强大到让人害怕的评论 (共条)