欢迎光临散文网 会员登陆 & 注册

逐梦显卡第三度,踌躇满志再出发

2020-08-23 15:03 作者:学生厘米  | 我要投稿

Intel一直立志成为成为全球互联网经济最重要的关键元件供应商,但是在此之前独立高性能显卡的设计和制造一直是Intel无法逾越的巨大鸿沟。前两次冲击均已失败告终,但Intel对第三次的Xe显卡似乎充满信心,那我们就赶紧来看看吧。

这次,Intel工程师们的思维总算恢复了“正常”,用了常规思维造显卡,挖来了AMD前首席GPU架构师、RTG部门主管Raja Koduri来负责Xe显卡的设计和制造。

Raja Koduri在英特尔架构日的演说截图

有意思的是Raja刚从AMD跳槽到Intel之后就在大力抨击老东家AMD,他说:“我在AMD看不到(GPU)未来,(AMD)无法与NVIDIA竞争。“说回Xe本身,它被分为Xe LP、Xe HPG、Xe HP和Xe HPC三个系列,其中Xe HPC系列将会服务于数据中心也就是我们常说的服务器市场,Xe HP将会服务于高性能工作站和DIY市场,如我们下文将会提到的DG2,就隶属于Xe HP,Xe HPG则是为游戏显卡市场服务,而Xe LP将会服务于笔记本等市场,如在CES2020上展示过的Intel DG1显卡就隶属于Xe LP系列,Tiger Lake内置的Gen12 GPU也是基于Xe LP系列的DG1进行改造的。

Xe产品的Roadmap

Intel整个Xe计划,其实还是和Larrabee一样,瞄着超算去的。Intel做Xe就是为了赚企业的小钱钱,这钱多好赚啊,哪还要搜刮我们这些又要性能还要便宜的DIY用户的钱包啊,做DIY市场就交个朋友,Almost不赚钱。(罗老师别这样罗老师)。当然我们这些臭打游戏的也搞不起超算,还是看看Intel碍于面子做的消费级首款高性能显卡DG2吧。日前,Intel在RKL的驱动中泄露了Intel的DG2显卡。

这是Intel年初在CES2020上的渲染图,并非终端产品
  • DG1 HW

  • iDG1LPDEV = "Intel(R) UHD Graphics, Gen12 LP DG1" "gfx-driver-ci-master-2624"

  • DG2 HW

  • iDG2HP512 = "Intel(R) UHD Graphics, Gen12 HP DG2" "gfx-driver-ci-master-2624"

  • iDG2HP256 = "Intel(R) UHD Graphics, Gen12 HP DG2" "gfx-driver-ci-master-2624"

  • iDG2HP128 = "Intel(R) UHD Graphics, Gen12 HP DG2" "gfx-driver-ci-master-2624"

从这些数据中我们可以看得到Xe HP DG2应该有128EU、256EU和512EU三个版本,根据TGL 96EU XeDG1的FP32性能大约在2-3TFlops不难推算出Xe DG2 128EU的版本或将会有4-5TFlops的性能,256EU的版本或将会有5-10TFlops的性能。根据外网的一些消息,Intel还给台式机工作站准备了更高规格的Xe HP GPU,规格如下。(来自WCCFTECH)

Xe Logo之一
  • Xe HP (12.5) 1-Tile GPU: 512 EU [Est: 4096 Cores, 12.2 TFLOPs assuming 1.5GHz, 150W]

  • Xe HP (12.5) 2-Tile GPU: 1024 EUs [Est: 8192 Cores, 20.48 assuming 1.25 GHz, TFLOPs, 300W]

  • Xe HP (12.5) 4-Tile GPU: 2048 EUs [Est: 16,384 Cores, 36 TFLOPs assuming 1.1 GHz, 400W/500W]

AnandTech给出的性能数据则略有不同(这个貌似可信度更高一些,来源是Intel最近的Architecture Day 2020活动中的Scaling Demo)

  • One Tile:10588GFlops(10.6TFlops)of FP32

  • Two Tile:21161GFlops(21.2TFlops)of FP32(1.999x of One Tile)

  • Four Tile:42277GFlops(42.3TFlops)of FP32(3.993x of One Tile)

对比NVIDIA和AMD的竞品, RTX2080的FP32性能约为10.07TFlops,功耗215W;RTX2080Ti的FP32性能为16.31TFlops,功耗250W;而Tesla A100的FP32性能为19.5TFlops,功耗400W。RX5700的FP32性能为7.9TFlops,RX5700XT的FP32性能为9.75TFlops,Radeon Pro Vega II的FP32性能14.2TFlops。综合来看,Xe不仅性能接近友商,能耗比也十分不错。(当然这玩意目前还是个饼,最终还是要看产品咋样)。

值得一提的是,Intel在Xe上使用了类似AMD在CPU上使用的CCX模块化设计,他们将自己的单个模块称为”Tile”,每个Tile包含了512EU,也就是4096个核心(你可以看作4096个Intel版的CUDA)。

Intel的“Tile”设计,图源Intel

目前Intel在Xe HP上最高提供4 Tile,也就是16384个核心。模块化的好处就是节约成本和可以轻松的改变硬件规格,这也是AMD做CPU的思路,正因为如此,AMD才能在消费级搞出16C32T的CPU,在企业级搞出64C128T的CPU,如果Intel这么做,相信可以成功杀入显卡市场,。而多Tile互联方面Intel将会使用祖传的MCM封装(胶水还没过时呢……),也有消息称将会使用新的Forveros和EMIB互联,希望是这样,2020年用胶水有点过分了(笑)。

我觉得这次的Xe显卡还行,毕竟Intel一直坚持HP(High Performance)库的设计,而不是和对手AMD一样使用HD(High Density)库设计,HP库虽然在同一节点下密度低成本高,但是可以更好的冲击高频,也不容易产生积热等问题。对于CPU/GPU这种热量散发较大,又没有像手机那样有非常严苛的功耗和体积限制的产品,HP库显然是更好的选择,否则NVIDIA也不会在台积电16nm制程节点下单独定制自己的12nmFFN制程。

显存上,Intel应当会使用三星提供的新的HBM2E显存,并将其与“Tile”封装在一个核心内,相比HBM2速度提升33%,根据Raja前些日子在Architecture Day 2020手持Xe HP产品的照片,4Tile产品的核心大小将会有巴掌那么大,鉴于它强大的性能(相当于双路NVIDIA Tesla A100了),也能接受。

最后,Intel的Xe HP产品将于2021年出货,非常值得期待。毕竟显卡市场两强争霸已经很久了,也需要注入一些新的活力,希望Intel的到来能让老黄的纳米级原子刀手下留点情,也能让苏妈那边的GPU得到更大的进步。以上就是本期专栏的全部内容啦~如果各位觉得我写的还有点意思,不妨给我来个三连,如果您有什么看法也欢迎您在评论区中和我分享,那我们下期再见!


逐梦显卡第三度,踌躇满志再出发的评论 (共 条)

分享到微博请遵守国家法律