欢迎光临散文网 会员登陆 & 注册

对phx的一些讨论,7840h以及相关马甲)

2023-02-16 20:35 作者:修改腻称需要6个硬币  | 我要投稿

phoenix的一些参数如上图,就不一一复读了,在这里仅代表我个人做一些理解上面的阐述。 phx相较rem的提升主要两点:频率以及芯片制程。ipc方面的提升在低功耗的稀释下几乎没有,可以看作5800h套了三次马甲。二缓的翻倍对于游戏性能的提升也聊胜于无,16m三缓是为了在cpu die内塞入12cu显卡所做的必要妥协,amd也想塞32mb三缓,可惜想不得,如是则需要对整个cpu die的图纸进行大刀阔斧的更改,其复杂程度无异于设计新架构。 所以我个人倾向认为amd的架构团队和苹果一样在优化了单die总线和统一大三缓后发生了大规模跑路,其ipc止步于2020年的zen2。 然而台积电的芯片制程也不是盖的,每一年的一点小小的能耗比提升在2018-2023五年光景中为amd提供了恐怖的能耗比优势,使amd可以用更小的电压跑出更高的频率,尽管amd在高功耗环境下由于架构劣势干不过i家,但是凭借台积电高能效制程使上代amd的8核小芯片在65w以下的中低功耗日常负载中就能干翻intel了

图片来源:硬件茶谈

之后再谈phx的显卡单元,如下图,超频+架构双重提升使得phx的fp32跑分提升了41%~46%,但是浮点规浮点,在ts的显卡分测试子项中phx几乎原地踏步。这是今天讨论的重点:为什么落到宇宙第一好玩的游戏—3dmark中,提频和架构的双重优势全部消失不见。这里要说一下ts的评分机制。

图片来源:golden pig upgradepack(手动滑稽

大量实验表明在外接显卡时,ts的显卡分会下降,即使使用m.2导出pcie4.0x8的信号与显卡互联时也会有3%~20%左右的性能损失,即使没有cpu与显卡间通讯带宽的限制。从这里我们可以推断出ts显卡分还与帧生成时间有关。在同样的帧率表现下,帧生成时间长的跑分结果会加上由于帧生成时间过长所带来的负加权。由于布线过长,即使是满带宽互联的外接显卡与笔记本cpu之间存在不小的延迟,增大了cpu与gpu互发指令的时间。有些指令是无法被预测的,因此卡需要等u的回传指令再进行下一步操作,这无疑增加了每一帧从cpu绘制到gpu渲染传输到显示器上的的时间。680m和780m亦是如此。导致帧生成时间过长有很多种原因,布线过长在apu上显然不成立,而内存带宽是其中之一,但是我个人认为windows对于核心显卡调用ddr内存的权限问题比物理带宽的限制更有可能限制780m的发挥。在偷跑的4050显卡ts分数中我们可以看出仅有的96bit gd6 显存总线宽度并未影响其发挥,4050与4060间ts跑分差异更接近于核心规模的差异。ddr5 5600的通信带宽为89.6gb/s,96bit gddr6x的带宽为186gb/s我们不妨将其之比与780m和4050的浮点性能之比做一些比较。带宽之比:0.48;fp32之比:0.36

由此可见,当ddr5内存带宽空闲时,物理带宽并没有限制780m核心规模的发挥

我个人倾向认为微软在Windows中更倾向于给cpu很高的带宽和大量已分配好的虚拟内存从而限制了核显发挥。这一点要在之后amd驱动的优化中来慢慢证实。

当内存带宽成为显卡瓶颈时,有以下三种常见的情况:1.普通清晰度高帧率 2.高清晰度中低帧率 3.高清晰度高帧率。

显然不是所有游戏中对于phx的核显,内存带宽都能成为性能的瓶颈

在当今游戏负载下,就算再给它12cu,780m凭自己实力也跑不满第三种情况因此作为phx的潜在用户们要做好游戏中的图形优化设置防止带宽瓶颈的出现。比如让780m跑2k游戏非常容易占满内存带宽,一旦内存带宽被占满,不只有帧率原地踏步这么简单的事情会发生,可能帧率忽高忽低,也可能一帧卡几秒,蓝屏微笑也不是不可能出现。做好游戏画质优化可以极有效降低以上情况的出现,让780m跑在均衡的清晰度和帧率的条件下。我个人相信对于ddr5 5600 双通道的能力绝对可以容下1200p 60~90fps左右的数据吞吐量同时保留足够的cpu私有虚拟内存带宽。其他的事情就看微软以及amd的驱动优化尿性了。 最后仅代表我个人做一下驱动表现好的情况下780m相较680m在低帧率表现的游戏中性能提升的预测:大胆一些30%

对phx的一些讨论,7840h以及相关马甲)的评论 (共 条)

分享到微博请遵守国家法律