欢迎光临散文网 会员登陆 & 注册

超越4090一万倍!英伟达的GPU强大到让人害怕

2023-08-11 17:09 作者:科研市  | 我要投稿

从最开始的AI绘图到如今的语言大模型、chatGPT等等,AI人工智能已经是各大互联网企业的新发展方向。借着AI浪潮,英伟达也顺利成为新兴行业的领军人物。近两年英伟达凭借着数据中心业务,从一家开发游戏硬件的企业变成了全球最大的算力供应商。今年英伟达也召开了多场发布会,但黄仁勋提到最多的不是游戏,而是生成式AI、数据中心、加速计算等新名词。

数据中心业务崛起并不代表英伟达放弃了游戏业务。目前英伟达的RTX 4090依然是顶级消费级GPU显卡,性能远超AMD和英特尔,而英伟达占据了80%以上游戏市场份额,游戏玩家的首选显卡依然是NVIDA。

笔者了解到,英伟达当前市值已突破1.1万亿,全球第一家市值突破万亿美元的芯片公司,也是当前市值仅次于苹果、微软、Alphabet、亚马逊的美股第五大科技股。

英伟达的计算卡已经成为衡量企业实力的标准之一,谁拥有NVIDA的计算卡越多,证明这家企业算力越强,开发资源就丰富,潜力越大。

例如我们所熟知的微软、Meta、亚马逊、腾讯、网易等互联网大厂都在争抢英伟达的H100、A100、A800等计算卡。

因为英伟达的产品性能过于强大,导致美国政府推出限制出口政策,当年国内市场已经出现一卡难求,部分显卡价格疯涨。

针对庞大的市场需求,英伟达已经加大产能,并且持续更新换代产品。今年5月的台北电脑展上,英伟达展示了用256个GH200 Grace Hopper超级芯片组成的超级计算机DGX GH200。DGX GH200人工智能超级计算平台所提供的AI算力是RTX 4090的一万倍!

笔者了解到, Grace Hopper超级芯片已经全面投产,这是DGX GH200超算平台和MGX系统的核心组件,专为处理海量的生成型人工智能任务而设计。

Grace Hopper 超级芯片是英伟达开发的基于Arm架构的CPU+GPU集成方案,将72核的Grace CPU、Hopper GPU、96GB的HBM3和512GB的LPDDR5X集成在同一个封装中,共有 2000亿个晶体管。这种组合提供了CPU和GPU之间惊人的数据带宽,高达1TB/S,为某些内存受限的工作负载提供了强大的性能。

目前最新的DGX GH200超算平台搭载HBM3e内存,内存容量从每个GPU96GB扩展到144GB,增加了50%。笔者了解到,HBM3e内存是一种新型的高带宽内存技术,在运算速度上HBM3e能比HBM3运算速度快50%,提供最高5TB/秒的传输速率。新内存让新GH200运行AI模型的速度提高了3.5倍。

DGX GH200超算平台内存能达到282GB,相比上代产品,容量增加了3.5倍,带宽增加了3倍。GH200还支持英伟达的NVLink,可以根据企业的需求组合成不同规模的形态,单卡、双卡、多卡服务器、机柜,甚至是超级计算机。

GH200可以组合成256张卡的DGX GH200SuperPod超级计算机,拥有144TB的快速内存,每秒可以执行10的18次方次浮点运算。如果单个DGX GH200超算平台还不能满足需求,英伟达还有专门的服务器机柜,官方人员会上门调试安装,一站式服务。总之,企业想要提升运算速度,只需要增加更多的服务器机柜就行。

按照官方说法,曾经1亿美元预算,只能建设一个小的数据中心,而且还需要购买800个×86GPU,耗费5兆瓦的电力。如果选择英伟达Grace Hopper计算方案,成本仅800万美元就能达到同等工作量。如果预算是1亿美元,选英伟达的Grace Hopper仅耗费3兆瓦的电力,而且数据吞吐量还能提高一个数量级。总之,同样的预算,英伟达的方案更省电,而且算力更高。而同样的算力,英伟达的成本更低。

笔者了解到,新款HBM3e内存的DGX GH200超算平台需要等到2024年的第二季度上市。而搭载普通HBM3内存的GH200按原计划在今年下半年正式发售。

针对个人开发者和小型企业,英伟达推出了新一代工作站显卡:RTX 5000、RTX 4500以及RTX 4000。RTX 5000采用了第4代Tensor Core和第3代RT Core,相比上一代GPU,单精度浮点运算性能提升了2倍,达到了90TFLOPS的峰值,配备高达32GB的GDDR6视频内存,支持ECC错误校验,适用于高端工作站、数据中心和云游戏。

RTX 4500配备24GB GDDR6视频内存,也支持ECC校验。光线追踪性能提升1倍,AI处理性能提升2倍,适合创意专业用户、小型工作站。RTX 4000是相同的GPU核心,配备20GB GDDR6视频内存,光线追踪和AI计算性能都有大幅提升。全新的RTX 5000已经发售,其余两款产品将在下半年陆续上市。

虽然AI的功能很强大,但部署AI大模型非常繁琐,门槛过高。为了降低门槛,英伟达将推出AI Workbench工具包。笔者了解到,AI Workbench提供配置AI模型所需框架、工具开发包等环境。开发人员能够在PC或工作站上快速创建、测试和自定义预训练的生成式AI模型,然后扩展到数据中心、公共云或NVIDIA DGX™云。

如果你想使用AI模型来绘图,但没有强大的硬件提供算力,也不懂如何部署模型,但有了AI Workbench,只需要选择一个4个RTX 6000云工作站,然后就能一键配置AI模型。如果对生成图片不满意,还可以自己上传图片,重新训练模型后再生成。

过去,由于硬件算力的限制,训练AI模型需要成千上万张A100显卡才能完成,不仅成本过高,而且难度也很大,效率较低。但现在有了DGX GH200,企业就不需要部署庞大的计算机集群,仅需要一套超算平台,就能完成工作任务。

笔者认为,英伟达的产品极大降低了AI行业门槛,无论你是个人,还是小微企业,只需要一个工具包,就能自己部署、训练AI模型,成功跨入AI时代。


超越4090一万倍!英伟达的GPU强大到让人害怕的评论 (共 条)

分享到微博请遵守国家法律