转载机翻一个大佬的zen4超频教程
原贴https://skatterbencher.com/2022/09/26/raphael-overclocking-whats-new/#AMD_Raphael_Processors
有些图可能没转过来
Raphael 超频:新增内容
彼得
发表于2022 年 9 月 26 日
11 条评论
Raphael 终于来了,就像每一代新产品一样,新的 CPU 意味着新的超频功能。
AMD全新AM5平台采用Raphael桌面处理器和Zen 4架构。AM5是AMD自2016年以来首款针对主流台式机的新插槽,恰逢向DDR5内存的过渡。
就像每个新 CPU 一样,都有新的超频功能。
在本文中,我们将深入探讨有关 Raphael 等 AM5 处理器超频的所有新内容。我们将深入探讨以下主题:
查看 AM5 平台,包括 Raphael 工艺、架构、SKU 和芯片组。
一般查看 CPU 时钟和电压拓扑
CPU核心超频,
无限织物超频
内存控制器超频
DDR5内存超频,
集成显卡超频。

在介绍了超频的理论方面之后,我们还将从实践角度介绍拉斐尔超频。
华硕Crosshair X670E基因超频工具
Raphael 对环境和极端冷却的超频期望
AMD Raphael 超频方法和 BIOS 配置的实际示例。

这篇博文主要针对那些对 AMD CPU 还不是很熟悉、想要更详细地介绍性能调优的来龙去脉的人。但希望它也能为经验丰富的 Ryzen 超频玩家提供一些信息。
好吧,我们有很多内容要讲,所以让我们开始吧。
目录
AMD Raphael 平台概述
AMD 拉斐尔工艺
AMD 拉斐尔架构
AMD Raphael 处理器
AMD Raphael 芯片组
AMD Raphael 拓扑
SMU——系统管理单元
精度提升基础设施限制
自适应电压频率调节
启动时间校准
电压自适应操作(时钟延长)
AMD Raphael 时钟拓扑
AMD Raphael 电压拓扑
AMD 串行 VID 接口 3 (SVI3)
AMD 精度提升 2
AMD Raphael CPU 核心超频
AMD Precision Boost Overdrive 2
超频模式
ECLK异步模式
CPU核心电压
AMD Raphael Infinity Fabric 超频
结构时钟
织物电压
AMD Raphael 内存控制器超频
内存控制器时钟
内存控制器电压
AMD Raphael 内存超频
DDR5 内存时钟
DDR5 内存时序覆盖
DDR5内存电压
AMD 超频扩展配置文件 (EXPO)
DDR 动态超频模式
内存上下文恢复
AMD Raphael 集成显卡超频
华硕 ROG Crosshair X670E 基因超频技术
华硕AI超频功能
华硕动态超频切换器
华硕电压暂停
华硕自定义算法
ROG 真正的伏尔提西亚人
AMD Raphael 超频预期
AMD Raphael 超频示例
超频概念
超频过程:基线
超频过程:微调
超频过程:示例
结论
AMD Raphael 平台概述
AMD Raphael 是 Ryzen 7000 系列主流桌面处理器的代号。它是 Vermeer Zen 3 Ryzen 5000 的后继产品,采用 Zen 4 CPU 微架构和全新的 AM5 插槽。
AMD 拉斐尔工艺
Zen 4 是 AMD 第一个使用台积电 5 纳米工艺改进版制造的核心。台积电的N5节点是他们采用EUV技术的第二代光刻机。

从 N7 升级到 N5 具有多种优势,包括工作频率的潜在提高、功耗的降低以及逻辑密度的提高。可以通过多种方式利用增加的逻辑密度。例如,制造更小(因此更便宜)的芯片,添加更多功能(如 AVX-512),或者优化芯片布局以实现更高的频率。
TSMC N5 使 AMD 在提高 8 核 Zen 4 CCD 的频率以及提高 16 核 Zen 4c CCD 的核心密度方面取得了重大进展。
AMD 拉斐尔架构
我不会像很多媒体那样详细介绍该架构,并且会详细介绍这一点。重要的是要知道 CPU 封装与前几代 Ryzen 处理器类似。
根据具体的 SKU,您会在 CPU 封装上找到两到三个芯片:一个或两个 CCD 和一个 IOD。
CCD 代表 Core Complex Die,是一个带有 Zen CCX 和无限结构连接的芯片。
CCX 代表 Core Complex,最多包含 8 个 Zen 4 核心,每个核心都有自己的 L1 和 L2 缓存以及共享的 L3 缓存。
IOD 代表 I/O 芯片,包括所有 IO 连接,包括 DDR5 内存控制器。
请注意,虽然 CCD 是在 TSMC 5nm 上制造的,但 IO Die 是使用 TSMC 6nm 制造的。

Zen 3 和 Zen 4 之间的主要架构差异包括:
支持AVX-512指令以实现AI加速
增加缓存大小
提高整体时钟速度
支持DDR5内存
支持 PCIe 5.0。
总体而言,从架构上来说,与 Zen 3 相比,Zen 4 更像是一场演变,而不是一场革命。
值得一提的是,Zen 4有2个衍生产品:带有3D V-Cache的Zen 4和Zen 4c。
带 3D V-Cache 的 Zen 4,顾名思义,就是在 Zen 4 CCD 的顶部附加一层 3D V-Cache。AMD 首先以 Zen 3 的形式推出了面向消费者的 Ryzen 7 5800X3D 和面向数据中心的 Milan-X 等产品。附加的 3D V 高速缓存大大扩展了给定 CCD 上可用的共享 L3 高速缓存。预计带有 3D V-Cache 的 Zen 4 将于明年开始发布。
Zen 4c 是一款专为数据中心云原生计算领导力而设计的新产品。在撰写本文时,人们对 Zen 4c 知之甚少,只知道它与 Zen 4 具有 ISA 同等性,但为了增加 CPU 内核而牺牲了 L3 缓存大小。Zen 4c 预计将于今年晚些时候推出,作为 Zen 4 EPYC 产品线的一部分。
根据 AMD 的 128 核 EPYC“Bergamo”公告,我们可以推测 Zen 4c CCD 具有 2 个 CCX,每个 CCX 具有 8 个 Zen 4 核心。这与 AMD 的说法一致,即从台积电 N7 到 N5 可提供 2 倍的密度提升。
可能不太明显的是,应该没有什么可以阻止 AMD 在主流平台上采用 Zen 4c。因此,它可能为AM5上的8+16甚至16+16核心设计打开大门。

AMD Raphael 处理器
Ryzen 桌面处理器有三种版本:Ryzen 9、Ryzen 7 和 Ryzen 5。到目前为止,我们只了解了 -X 变体。但是,可以合理地假设我们将来也会看到非 X 较低功耗的变体。
首发的 SKU 包括 16 核 Ryzen 9 7950X、12 核 Ryzen 9 7900X、8 核 Ryzen 7 7700X 和 6 核 Ryzen 5 7600X。
Ryzen 9 7950X处理器有2个CCD,每个CCD有8个Zen 4核心,总共16个核心和32个线程。基础频率为4.5 GHz。宣传的 Precision Boost 2 升压频率为 5.7 GHz。处理器TDP为170W,PPT为230W。
Ryzen 9 7900X处理器有2个CCD,每个CCD有6个Zen 4核心,总共12个核心和24个线程。基础频率为4.7 GHz。宣传的 Precision Boost 2 升压频率为 5.6 GHz。处理器TDP为170W,PPT为230W。
Ryzen 7 7700X 处理器有 1 个 CCD,每个 CCD 有 8 个 Zen 4 核心,总共 8 个和 16 个线程。基础频率为4.5 GHz。宣传的 Precision Boost 2 升压频率为 5.5 GHz。处理器TDP为105W,PPT为142W。
Ryzen 5 7600X处理器有1个CCD,每个CCD有6个Zen 4核心,总共6个核心和12个线程。基础频率为4.7 GHz。宣传的 Precision Boost 2 升压频率为 5.3 GHz。处理器TDP为105W,PPT为142W。

默认 Precision Boost 2 算法参数限制可在下表中找到。

AMD CPU 的全新之处在于集成显卡。集成显卡的唯一用途是作为显示控制器和基本媒体解码器。它绝对不适合用于游戏。
Raphael CPU 中包含的集成显卡品牌为 AMD Radeon Graphics,并带有 GFX1036 ID。它采用 RDNA 2 架构,属于 Navi 2 产品系列的一部分。集成显卡有 2 个计算单元,配有 128 个流处理器和 1 个光线加速器。这使得它的规格比 Radeon RX 6400 低 6 倍。基本时钟频率为 600 MHz,负载下的升压频率为 2200 MHz。

AMD Raphael CPU 适合 AM5 LGA1718 插槽,可在 AMD 600 系列主板上运行。与其前身一样,AM5 预计将拥有跨越多代 Zen 处理器的较长生命周期。
AMD Raphael 芯片组
随着适合新插槽的新 CPU 出现,带有新芯片组的新主板也随之而来。虽然我不会深入介绍芯片组的功能,但简短的概述从来都不是坏事。
与AMD设计的X570芯片组不同,600系列芯片组完全外包给ASMedia。被称为 Promontory 21 的 600 系列芯片组预计有 3 种配置:
高端X670
中端B650
低端A620
主要区别在于 X670 采用 2 个菊花链式 B650 芯片组,而 A620 是失效的 B650 芯片组。X670 和 B650 都有 -E 变体。-E 和非 E 之间的区别在于,具有 -E 名称的主板需要支持主 PCIe 和 M.2 插槽的 PCI-e 5.0。

在性能方面,当所有通道都在使用时,您可能会预期 X670 上存在潜在的带宽瓶颈。这是因为辅助芯片组数据首先通过 PCIe 4.0 x4 通道到达主芯片组(具有自己的 IO),然后再次通过 PCIe 4.0 x4 链路最终到达 CPU。

X 系列和 B 系列芯片组都支持超频。相比之下,A系列预计不支持任何超频。
AMD Raphael 拓扑
在我们进行超频之前,让我们首先看看时钟和电压的拉斐尔拓扑。
AMD Raphael 时钟拓扑
AMD Raphael 的时钟与上一代 Zen 3 Vermeer 桌面 CPU 类似。

标准 Raphael 平台具有连接到集成 CGPLL 时钟发生器的 48 MHz 晶体输入。然后,CGPLL 为 USB PLL 生成 48 MHz 时钟,为 FCH 生成 100 MHz 参考时钟,其中包含用于 CPU 内核的 CCLK PLL 和多个 SOC PLL。
CCLK PLL 100MHz 参考时钟驱动 200 MHz VCO,然后将其乘以 FID 并除以 DID。总体而言,这提供了 25 MHz 的 CPU 时钟频率粒度。
与 Vermeer 一样,每个 CCX 都有自己的 PLL,CCX 内的内核以相同的频率运行。
SOC PLL 包括 IO 裸片上存在的各种 PLL。与超频最相关的是:
用于数据结构的 FCLK
UCLK 用于内存控制器
MCLK 用于系统内存
GFXCLK 用于集成显卡
与 Zen 3 不同,默认情况下,内存控制器、系统内存和数据结构不再以相同的频率运行。这是因为 DDR5 内存可以以比 DDR4 高得多的频率运行,而结构时钟却不能。
FCLK 是用于表示无限结构时钟频率的术语。默认情况下,频率为 1733 MHz,但可以使用可用的频率选项将其设置为 3000 MHz。
UCLK 是用于统一内存控制器时钟频率的术语。默认情况下,它以与系统内存相同的频率运行,但如果系统内存超过 DDR5-5800,主板自动规则可能会将其频率降低到一半。它相对不灵活,因为它可以以相同或一半的系统内存频率运行。使用可用的频率选项可以超频至 6000 MHz。
MCLK 是用于系统内存时钟频率的术语。默认情况下,它是内存控制器频率的相同或两倍。使用可用的内存比率选项可以超频至 DDR5-12000
GFXCLK 是用于集成图形核心时钟频率的术语。现货时,在 3D 负载期间它将达到 2.2 GHz。目前无法超频。
Raphael 的新功能是 eCLK 模式的回归。ECLK 代表外部时钟,正如该术语所暗示的那样:外部时钟发生器。它之前在 Ryzen 2000 Pinnacle Ridge 处理器上可用,但后来被删除。
除了标准的内部 CGPLL 之外,Raphael 还支持最多两种外部时钟模式。它们称为 eCLK0 模式和 eCLK1 模式。
在 eCLK0 模式(也称为同步模式)下,外部 100MHz 参考时钟用于 CPU PLL 和 SOC PLL。换句话说,它是影响CPU核心时钟以及PCIe和SATA时钟的参考时钟。USB PLL 仍然由 48 MHz 晶振通过 CGPLL 驱动。

在 eCLK1 模式(也称为异步模式)下,有两个不同的外部 100MHz 参考时钟。一个时钟为 CPU PLL 提供 100MHz 输入,另一个时钟为 SOC PLL 提供 100MHz 参考时钟。AMD 建议 CPU 核心参考时钟最高可达 140 MHz,但您的情况可能会有所不同。USB PLL 仍然由 48 MHz 晶振通过 CGPLL 驱动。

AMD Raphael 电压拓扑
从电压拓扑的角度来看,有一些细微的变化。与 Vermeer 一样,该处理器仍然依赖内部和外部电源来生成处理器电压。
从主板 VRM 到处理器有四个主要电源:VDDCR、VDDCR_SOC、VDDCR_MISC 和 VDDIO_MEM_S3。

VDDCR电压轨为两个内部稳压器提供外部电源:VDDCR_CPU 和 VDDCR_VDDM。
VDDCR_CPU 为 CCX 内的 CPU 内核提供电压。在具有多个 CCX 的 CPU 上,每个 CCX 都有自己的 VDDCR_CPU 电压轨,但电压相同。电压轨可以在常规模式或旁路模式下工作,但在 Raphael 上,它始终处于旁路模式。这意味着电压始终等于 VDDCR 外部电压。
VDDCR_VDDM 为 CCX 上的 L2、L3 和 3D V 高速缓存(如果存在)提供电压。在有多个 CCX 的 CPU 上,每个 CCX 都有自己的 VDDCR_VDDM 电压轨。该轨不能工作在旁路模式下;因此,它始终由 VDDCR 外部电压轨进行内部调节。默认 VDDM 电压为 0.95V
关于旁路模式的简单介绍。与之前的平台一样,AMD 广泛使用全数字集成电压调节器。稳压器是超高效率数字低压差或 dLDO。大多数电源域(包括 CPU 内核、缓存、结构等)都具有可单独控制的 dLDO。然而,大多数 dLDO 在 Raphael 等消费器件上都被永久绕过。这意味着稳压器被禁用,电压调节通过 VRM 在主板上进行。一个典型的例子是 CPU 内核的电压。

CPU 内核的 dLDO 仍然存在于 CCD 上,就像 Ryzen 5000 系列处理器一样。但是,最终用户无法启用它们。但我们仍然可以向您展示它如何使用专门的工具来工作。
我们可以使用 SuperPI 32M 等单线程应用程序来说明该行为。
出于稳定性原因,我必须将 Fmax 设置为 4550 MHz,将曲线优化器设置为 +30。然后我使用 HWiNFO 记录系统信息。
现在,如果我们运行分配给核心 1 的 SuperPI 32M 并检查每个核心的 VID,我们会发现它们在 1124mV 左右几乎相同。这与 VDDCR_CPU 电压轨几乎相同。这是有道理的,因为禁用 dLDO 意味着我们将其置于旁路模式并直接从 VDDCR_CPU 电压轨为所有 CPU 内核供电。


当我们使用专门的工具启用 dLDO 并运行相同的测试时,我们发现每个核心的核心 VID 现在完全独立。运行 SuperPI 32M 的核心运行电压为 1100mV,而其他核心运行电压较低,介于 1085mV 和 1115mV 之间。VDDCR_CPU 电压轨仍为 1126mV。


如果我们查看功耗,我们会发现Core 1在旁路模式下的功耗为4.27W,在dLDO模式下的功耗为4.15W。差异为 3%。当我们查看第一个 CCD0 中的其余内核时,我们发现空闲时的平均功耗在旁路模式下为 0.19W,在 dLDO 模式下为 0.15W。两者相差 21%。第二个 CCD 中的内核在旁路模式下闲置时的功耗仅为 0.04W,在 dLDO 模式下闲置时的功耗仅为 0.03W。差异为 16%。
不幸的是,当核心电压高于 1.25V 时,似乎无法运行 dLDO 模式。
VDDCR 电压轨可通过 SVI3 接口直接控制。VDDCR_VDDM 无法由最终用户控制
VDDCR_SOC电压轨为各种 IP 模块(包括但不限于内存控制器、SMU、PSP、图形等)的 SOC 上的多个内部稳压器提供外部电源。必须知道,VDDCR_SOC 电压必须始终为低于 VDDIO_MEM_S3 + 100mV。默认 VDDCR_SOC 电压为 1.05V。
VDDCR_GFX 为 IO 芯片上的 GPU 内核提供电压。电压轨可以在常规模式或旁路模式下工作。在常规模式下,电压由集成稳压器管理并源自 VDDCR_SOC 电压轨。当集成 VR 在旁路模式下被禁用时,电压等于 VDDCR_SOC 电压轨。
VDDCR_SOC 电压轨可通过 SVI3 接口直接控制。
VDDCR_MISC电压轨为内部调节的 VDDG 电压轨提供外部电源。VDDG 是无限结构数据路径的电源电压。共有 4 个可独立配置的 VDDG 电压:CCD0-CCD、CCD0-IOD、CCD1-CCD 和 CCD1-IOD。每个代表一个特定的 GMI 链接连接
CCD0-CCD VDDG:从CCD0发送到IOD的信号以此电压发送
CCD0-IOD VDDG:从IOD发送到CCD0的信号在此电压下发送
CCD1-CCD VDDG:从CCD1发送到IOD的信号以此电压发送
CCD0-IOD VDDG:从IOD发送到CCD1的信号以此电压发送
超频 DDR5 内存时,您可能需要手动增加 VDDG 电压,因为更改 VDDCR_MISC 电压时它不会自动调整。
VDDCR_MISC 电压轨可通过 SVI3 接口直接控制。相反,VDDG 电压只能使用 CPU 寄存器进行配置。默认 VDDCR_MISC 电压为 1.1V,默认 VDDG 电压为 0.85V
VDDIO_MEM_S3电压轨为 VDDP_DDR 内部稳压器提供外部电源。VDDP 是 DRAM PHY 的电压。通常,VDDIO_MEM_S3 应始终高于 VDDP_DDR + 100mV。内存超频时,您可能需要手动增加 VDDP 电压,因为更改 VDDIO_MEM_S3 电压时它不会自动调整。默认 VDDIO_MEM_S3 电压为 1.1V。默认 VDDP 电压为 0.8V。
AMD 串行 VID 接口 3 (SVI3)
AM5 Raphael CPU 支持新的 AMD SVI3 标准。SVI 代表串行 VID 接口,是 AMD 设计的 VR 控制器接口。
AMD 于 2006 年 1 月向 NDA 合作伙伴推出了第一代SVI,作为其 PVI 技术的后继产品。大约一年后,它随 Socket AM2+ 处理器一起推向市场。
SVI 的主要优点是它在 CPU 和 VR 控制器之间提供了符合 I2C 标准的接口。I2C 仅需要 3 个连接,分别用于数据 (SDA)、时钟 (SCL) 和接地 (GND)。这样就无需增加电压调节器和 CPU 之间的并行连接数量来支持其他功能。
第二代 SVI 于 2010 年 2 月向 NDA 合作伙伴提供,并提供一系列功能,包括更精细的电压选择、更快的数据速率和遥测功能。它于 2012 年随 Socket FM2 Trinity 处理器一起推向市场。
第三代SVI 于 2018 年 11 月向 NDA 合作伙伴提供,并首先在 2022 年 Ryzen 6000 Rembrandt 移动 APU 上实现,现在也可在 AM5 Raphael 上使用。
串行 VID 接口版本 3 旨在为 AMD 平台上的电源管理提供可扩展的单主、多从通信总线。SVI3 与 SVI2 和所有以前的 AMD 电源管理接口存在显着差异。
相似之处包括:
单主接口
3 线推挽信号(来自主站)
专用遥测总线
主要差异包括(但不限于):
多从站接口支持多达 63 个具有显式寻址的设备
菊花链遥测拓扑
直接寄存器读/写功能
SVI3 并未设计为向后兼容 SVI2,因此 SVI3 设备不需要在 SVI2 总线上运行。然而,高级从设备可能具有在 SVI2 模式下工作的能力。
AMD 精度提升 2
Precision Boost 2 是一项自动性能最大化技术,自 2018 年 Ryzen 2000 系列以来的所有 AMD Ryzen 处理器均采用该技术。该技术通过动态提高处理器时钟速度来提高系统性能。
Precision Boost 2 的行为取决于多个因素,包括温度、功耗、电流消耗和活动内核的数量。
我们没有有关 Precision Boost 2 算法如何与 Zen 4 Ryzen 7000 CPU 配合使用的最新信息。然而,AMD 在 2018 年题为“Zeppelin”:用于多芯片架构的 SoC 的论文中详细介绍了 Precision Boost 如何在第一代 Zen 上工作。我们可以假设该技术本质上仍然以相同的方式工作。
SMU——系统管理单元
Precision Boost 魔法由 SMU 执行。SMU 是系统管理单元的缩写。Raphael CPU 上的每个芯片都有一个 SMU,这意味着 Raphael CPU 上有 3 个 SMU,带有 2 个 CCD 和 1 个 IOD。其中一个 SMU 将作为主 SMU,而其他 SMU 将作为从 SMU。通常,IO 芯片中的 SMU 是主 SMU。所有 SMU 均使用称为 SCF 或可扩展控制结构的低带宽控制总线进行连接。
SMU 具有一系列功能,其中最重要的是能够在基础设施限制内管理 CPU 性能。基础设施限制了各种指标的最大运行限制,包括功耗、温度和电压。我们没有一个全面的、经过确认的指标列表,尽管有些指标已向最终用户公开。在 Raphael 上,暴露的基础设施限制包括以下内容:SPL、PPT、EDC、TDC、THM、HTFMax、ProcHot、Voltage、CState Boost、STAPM、PPT Fast 和 PPT Slow。稍后我们将仔细研究其中的每一个。
从 SMU 的主要功能是捕获与基础设施限制相关的测量数据,然后准备将该数据发送到主 SMU。主 SMU 的主要功能是分析整个封装范围的测量数据并确定性能管理所需的操作。
每个基础设施限制都有自己的算法,并由主 SMU 独立管理,以确定基础设施限制频率。每种算法的流程如下:
从从 SMU 接收数据
将数据聚合到单个评估中,输出是给定基础设施算法的最大频率限制
将结果输入 PID(比例积分微分)控制器,该控制器可以在较长时间内平滑响应并避免尖峰或快速变化
PID 控制器的变化输出是给定时间特定基础设施限制所允许的最大频率。
对于每种算法,此过程大约每 1 毫秒重复一次。
然后固件选择最具约束力的限制作为全局频率限制。
然后,有两种情况可能发生:当前频率超过限制,或者没有。如果是这样,频率就会降低。如果没有,则存在频率余量,并且频率将会增加。
无论哪种方式,主 SMU 都会将频率更改请求传递给从属设备,并且每个从属设备将频率更改应用于本地芯片的 CPU 内核。频率变化由主 SMU 与全局电压层协调。
如果频率增加,主设备首先向外部电压调节器发送 VID 电压命令,然后再向从属 SMU 发送频率增加命令。
如果频率降低,主机首先向从机发送频率改变请求。然后等待频率变化被确认。最后,它向电压调节器发送VID电压命令。
从SMU可以根据本地情况独立决策。因此,如果片上条件需要,它可以应用比主 SMU 请求的频率更低的频率。例如,一个 CCX 在全核工作负载中的运行频率可能低于另一个 CCX。此外,当 dLDO 启用时,每个 SMU 可以独立调整 CCX 内每个内核的电压。
精度提升基础设施限制
现在,让我们仔细看看向最终用户公开的 Precision Boost 基础设施限制器。虽然所有这些限制器都存在于 Ryzen 7000 CPU 上,但这并不意味着它们全部处于活动状态或已配置。某些限制器与桌面系统无关,可以忽略。
持续功率限制(SPL)是电源和散热解决方案可以无限期维持的处理器功率。它也称为 TDP。
封装功率跟踪(PPT)是在升压趋于平稳之前处理器可以从插座汲取的总功率。通常,限制因素是您的 CPU 散热解决方案。
在技术文档中,你会发现PPT实际上是三个与功耗相关的选项的组合:PPT APU(PPT)、Fast Package Power Tracking(fPPT)和Slow Package Power Tracking(sPPT)。根据您的平台,可能不会使用其中一些参数。对于桌面Raphael,Fast PPT是我们在配置PPT时覆盖的参数。
电气设计电流(EDC) 表示电压轨在瞬态条件下在短时间内、热影响较小的时间内可能需要的最大峰值电流。独立的 EDC 调节可用于 VDDCR 和 VDDCR_SOC 电压轨。通常,限制因素是 VRM 组件的选择及其最大额定规格。
热设计电流(TDC)表示稳压器可以支持的最大持续电流。独立的 TDC 调节可用于 VDDCR 和 VDDCR_SOC 电压轨。通常,限制因素是 VRM 热解决方案和 VRM 组件的选择。
热(THM) 表示 SMU 内部的热模块,其中包含所有温度传感器、控制和报告功能。THM 限制是允许的最高处理器工作温度,通常称为 TjMax。
高温 Fmax或 HTFMax,表示高工作温度下允许的最大频率。此限制器特定于 SKU,可能存在也可能不存在。例如,在 7600X 上,HTFmax 限制器在 70 摄氏度时从 5450 MHz 开始。频率线性降低,直到 95 摄氏度时达到 5150 MHz。然而,在 7900X 上,这个限制器似乎不存在。
处理器热(PROCHOT)是主板设计中的一个信号,它告诉处理器其他系统元件过热并允许处理器限制性能。
皮肤温度感知电源管理(STAPM)代表处理器在整个系统的热预算内可以使用的最大功率。它与封装功率类似,但也考虑了系统热容余量。它主要与笔记本电脑相关,与台式机无关。
CState Boost是早期工程样本中存在的特定升压限制器。实际上,当超过一定数量的活动核心时,C-State Boost 会限制最大频率。对于 16 核 7950X,当超过 4 个核心处于活动状态时,C-State Boost 限制将强制 CPU 以 5.2 GHz 运行。此 Precision Boost 限制器在零售处理器上不起作用。
故障时间(FIT)是半导体行业使用的标准可靠性工程指标。它表示组件在其生命周期内出现故障的比率。对于半导体来说,工作电压和温度是与故障最相关的因素。AMD 的实时可靠性监控技术结合了高性能微处理器长期可靠性的两个关键限制因素:随时间变化的电介质击穿 (TDDB) 和电迁移 (EM)。
FIT 率使用以下公式以 1 毫秒为间隔计算。其中下标变量是基于铸造工艺可靠性模型的曲线拟合。因此,对于 Raphael 来说,这是基于台积电提供的可靠性模型。然后,计算出的 FIT 率通过滤波器,以确保更平滑的过渡,防止频率变化太快。简而言之,如果 FIT 率低于目标阈值,则存在额外的频率余量。假设 FIT 率高于目标阈值。在这种情况下,频率余量会降低,以防止产品生命周期中出现任何早期处理器故障。
电压识别(VID)是 CPU 和电压控制器传达电压请求的一种方式。VID 限制是处理器允许的最大电压。VID 限制是工厂设定的,最终用户(不再)无法更改。
融合最大频率或 Fmax 是允许的最大处理器频率。这个值是从工厂融合出来的,显然是CPU规格的核心部分。
自适应电压频率调节
到目前为止,我已经讨论了 Precision Boost 2 技术对最大允许频率施加限制的不同方面。然而,我们还没有讨论最大频率是如何计算的。
自 2015 年 Carrizo APU 以来,AMD 一直使用自适应电压频率缩放(AdaptiveVoltageFrequencyScaling,简称 AVFS)。该技术依靠关键路径累加器来估计 CPU 内部电路的最大稳定频率。如果这听起来很复杂,那是因为事实确实如此。不过,我会尽力尽可能简单地解释它。

长话短说,AMD 在电路中添加了副本路径,除了评估电路是否稳定之外没有其他目的。AVFS技术从复制路径中提取高斯分布统计模型。它使用采样统计推断“真实”路径的稳定性。SMU 使用此统计数据来创建电压-频率-温度(或 VFT)表。

VFT 表是特定于部件的查找表,其中包含有关频率和电压任意组合的最佳电压的信息。频率和温度越高,确保稳定性所需的电压就越高。


虽然从 CPU 中提取此 VFT 表是不可能的,但我可以在一定程度上说明其行为。
在本例中,我将工作负载分配给特定的 Zen 4 核心。我跟踪了不同频率和温度下的 VID 请求。我在三种情况下将 Precision Boost Fmax 配置为 4600、5000 和 5450 MHz

我们可以从表中得出三点观察。
首先,显然,对于更高的频率,CPU 需要更高的电压。
第二,对于给定的频率,随着温度的升高,CPU 需要更高的电压。例如4.6GHz在40摄氏度以下使用1.020V,在90摄氏度以上则使用1.068V。同样,5.0GHz 40度以下使用1.145V,90度以上使用1.244V。
第三,你可以看到CPU在高温下不会提升到最高频率。例如,超过80摄氏度时,最高频率为5300 MHz、1.368V。这是我们之前讨论的 Precision Boost 频率限制器的结果。



2015 年,这个 VFT 表由 10 行和 8 列组成,因此有 80 个不同的数据点。目前还不完全清楚 Zen 4 Ryzen 7000 是否仍然存在这种情况。此外,CPU 内的每个核心都有自己的 VFT 表,因此对于 16 核 Ryzen 9 7950X,您将拥有 80×16=1,280 个数据点。


请注意,此 VFT 表是在制造过程中创建的工厂融合表。
启动时间校准
现在我听到你问:“如果我的电源坏了怎么办?” 好问题!
AMD 使用自动测试设备 (ATE) 将 VFT 表融合到 CPU 上。该测试设备通常提供比消费电源更稳定、噪音更小的电源。为了弥补这一点,AMD 使用测试仪到平台 (T2P) 电压偏移。它通常是一个保守的超边际值。
AMD 采用启动时间校准 (BTC) 过程来微调电压偏移。本质上,在启动过程中,CPU 可以检查供电的质量。根据质量,它会抵消工厂融合的 VFT 表。如果你有一个很大的电源,偏移会更小。如果你的电源很糟糕,那么偏移就会更大。


启动时间校准调整电压偏移的实际含义是,根据电源网络,同一 CPU 可以有不同的电压。供电网络包括电源、主板VRM以及墙壁插座和CPU核心之间的其他电气元件。

强大的电源网络将导致测试仪与平台之间的电压偏移更小,从而产生更低的工作温度。相反,较差的电源网络会导致较大的启动时间校准电压偏移,从而导致较高的工作温度。

我没有时间在现实世界中测试这一点,但可能有真正的科技媒体尝试这一点。
启动时间校准是 Precision Boost 技术的一个基本要素,但在将 CPU 切换到 OC 模式时会被禁用。
电压自适应操作(时钟延长)
尽管拥有 AVFS、特定于部件的 VFT 表、T2P 电压偏移和 BTC 等先进技术,AMD 仍无法预测现实世界中会发生什么。有时,在从空闲到负载(反之亦然)的瞬态条件下,电压下降非常严重,以致系统崩溃。
幸运的是,AMD CPU 还具有电压自适应操作技术,通常称为时钟拉伸。
该技术由两个电路组成:一个电路用作可配置的下垂检测器,第二个电路用作可配置的数字频率合成器。例如,我们可以配置为,如果检测到 2.5% 或以上的电压降,则时钟周期增加 5%。


效果很简单:如果检测到电压下降,有效时钟频率就会降低,以确保连续运行而不是系统崩溃。在现实世界中,这项技术在超频时非常重要,因为它可能会导致给定频率下的有效性能低于预期。
幸运的是,我们可以使用 HWiNFO 等工具快速检查我们的系统是否存在时钟拉伸。
时钟拉伸的实际含义是有效时钟频率将低于配置的核心频率。

区分这两个术语非常重要。
核心频率由参考时钟乘以主板和处理器配置的 CPU 比率得出。它是特定时刻配置频率的快照。它通常是您在 CPU-Z 等工具中看到的频率。
有效时钟频率是两个时刻之间的总时钟周期。它测量一段时间内处理器的实际性能。您可以使用 HWiNFO 等特定工具检查该值。
如本示例所示,两个时刻之间的有效时钟可能低于在这两个时刻拍摄的核心频率快照。这可能是由于工作负载、核心空闲时的节能功能或时钟拉伸等环境变化造成的。

检查是否发生时钟拉伸的最佳方法是将核心频率与有效时钟进行比较。假设系统负载时有效时钟明显低于配置的核心频率。在这种情况下,您的系统上可能会发生时钟拉伸。
如果您提高了 CPU 频率,但基准性能却停滞不前,甚至有所下降,那么时钟拉伸可能就是原因。
AMD Raphael CPU 核心超频
Zen 4 Raphael CPU 核心的超频与 Zen 3 Vermeer 高度相似,因此对于当前的 Ryzen 用户来说,熟悉 Raphael 超频并不会太困难。
对于那些刚接触 AMD Ryzen 的人,我将尽力让您快速了解一切的工作原理。为了尽可能简单,AMD 提供了两种超频途径:Precision Boost Overdrive 和 OC 模式。
Precision Boost Overdrive 允许您调整一些控制 Precision Boost CPU 频率提升算法的参数。通过调整参数,可以获得更好的性能。
OC 模式会禁用自动频率提升技术,并让您手动控制某些频率和电压参数。
AMD Precision Boost Overdrive 2
Precision Boost Overdrive 2(或 PBO 2)是 AMD 强大的超频工具包,可让您调整一些控制 Precision Boost 2 算法的参数。通过调整,您有可能在更长的时间内实现更高的工作频率,从而显着提高系统的性能。
Precision Boost Overdrive 的一个重要优势是它保留了 Precision Boost 中存在的所有智能频率提升机制。这意味着您可以获得高频单核和中频全核的提升。这使它与手动超频区分开来,正如您将在本文后面看到的那样。

Raphael 的 Precision Boost Overdrive 2 工具包与 Vermeer 相同,因此任何已经熟悉这些选项的人都可以跳过博客文章的这一部分。我很乐意为那些不知道的人重申它是如何工作的。
共有七种工具可用于调整 Precision Boost 2 算法:
4x 平台配置工具:PPT、EDC、TDC、热节流阀
3x CPU 配置工具:标量、升压覆盖和曲线优化器。
封装功率跟踪(PPT)是在升压趋于平稳之前处理器可以从插座汲取的总功率。通常,限制因素是您的 CPU 散热解决方案。
电气设计电流(EDC) 表示电压轨在瞬态条件下在短时间内、热影响较小的时间内可能需要的最大峰值电流。独立的 EDC 调节可用于 VDDCR 和 VDDCR_SOC 电压轨。通常,限制因素是 VRM 组件的选择及其最大额定规格。
热设计电流(TDC)表示稳压器可以支持的最大持续电流。独立的 TDC 调节可用于 VDDCR 和 VDDCR_SOC 电压轨。通常,限制因素是 VRM 热解决方案和 VRM 组件的选择。
Platform Thermal Throttle允许用户降低允许的最高处理器温度。可配置值的范围从 0 到产品特定的 TjMax,通常为 95 摄氏度。通常不建议降低热节流点,因为这会对您的性能产生负面影响。但是,如果您想运行尽可能低的温度,它会很有帮助。

Scalar是一种工具,允许用户覆盖保证的硅应力水平 (FIT),以实现更高的频率。您可以将允许的最大 FIT 级别调整为比工厂熔断限制高 10 倍。虽然该工具提供精确的粒度,但通常您会发现可用选项范围在 1X 到 10X 之间,步长为 1 倍。
增加标量的效果是 Precision Boost 算法应该积极追求更高的电压,因为它不太关心 CPU 的使用寿命。
升压时钟覆盖(Boost Clock Override)或 Fmax 覆盖(Fmax Override)允许用户以 25 MHz 为步长覆盖 -1000 MHz 至 +200 MHz 之间的任意时钟频率限制。它可用于 CPU 核心时钟和图形核心时钟(如果存在)。需要注意的是,覆盖仅调整频率的上限,并不起到频率偏移的作用。最终,Precision Boost 2算法仍然决定了实际的工作频率。
在某些主板上,您可能会看到高于 +200 MHz 的 Fmax Override 选项。虽然可以将这些值写入处理器寄存器,但它们实际上不会被应用。
Curve Optimizer是一款允许用户调整每个 CPU 内核的电压裕度的工具。它通过偏移 CPU 核心 VFT 表的电压来实现这一点。虽然您无法精确控制每个频率温度点的电压,但 Curve Optimizer 可以让您有效地降低 CPU 电压。
曲线优化器允许最终用户为每个 CPU 内核单独调整工厂融合的 VFT 曲线或电压-频率-温度曲线。VFT 曲线是 CPU 内每个内核的独特曲线,它定义了给定温度下给定频率所需的电压。更高的频率或更高的工作温度需要更高的电压。
曲线优化器通过偏移工厂融合的 VFT 曲线的电压来调整 VFT 曲线。通过设置正偏移,可以增加电压点。相反,您可以通过设置负偏移来降低电压点。
您可以将整条曲线向正方向偏移最多 30 步,向负方向偏移最多 300 步。每一步代表大约 5mV。
负曲线优化器已扩展到 300 个步骤,这似乎很奇怪。我稍后再讲
AMD Ryzen CPU 的传统超频方法是设置负曲线优化器。当您使用负点偏移调整 VFT 曲线时,会发生两种情况。
您有效地告诉 CPU 对于给定频率它需要更低的电压。因此,在给定电压下,它可以施加更高的频率。因此,当 Precision Boost 2 算法确定有足够的功率和温度余量来使用 1.35V 时,在负点偏移的情况下,它将瞄准更高的频率。
CPU 温度会较低,因为在给定频率下使用的电压较低。额外的热余量还将鼓励 Precision Boost 算法瞄准更高的电压和频率。
现在,回到负 300 曲线优化器。这个有点难以说明,因为 BIOS 选项和公共工具最多只允许 30 个步骤。然而,通过非公开工具,我能够收集更多数据。
该方法很简单:在调整曲线优化器设置时,我记录工作负载期间的实际电压和有效时钟频率。我在三种情况下执行此操作,其中我改变了 CPU Vcore 电压调节器的电压偏移。
快速提醒一下:CPU 将通过 VID 请求向电压调节器发出电压请求。然后电压调节器根据该请求调整电压输出。当我们使用负曲线偏移时,CPU 的 VID 请求较低,因此电压调节器的电压输出较低。我们还可以配置电压控制器以向 VID 请求添加正偏移。那么输出电压将是 CPU VID 加上控制器的任何偏移量。
场景包括:0mV 偏移、+50mV 偏移和+100mV 偏移。
首先,查看曲线优化器设置和实际电压的图表。如您所见,向电压控制器添加电压偏移可以调整负曲线优化器对有效电压的影响。
例如,在-40曲线优化器下,实际电压为
1.22V,0mV 偏移,
1.257V,+50mV 偏移,以及
1.288V,+100mV 偏移。
此外,1.22V 是通过曲线优化器设置实现的
-40,0mV 偏移,
-52,具有 50mV 偏移,以及
-64,偏移 100mV。
其次,我们看一下电压/频率曲线图。在这里我们可以看到曲线优化器和电压偏移对工作频率的影响。该曲线是同质的,表明 Precision Boost 算法始终尝试最大化给定工作电压的频率,无论曲线优化器或电压偏移如何。
我们可以看到,在 1.23V 时,频率为
5290 MHz,具有 -29 曲线优化器和 0mV 偏移,
5298 MHz,具有 -50 曲线优化器和 +50mV 偏移,以及
5306 MHz,带 -62 曲线优化器和 +100mV 偏移
进一步的实验表明,高达 -72 的电压是稳定的,偏移量为 +150mV。使用 +750mV 偏移,我可以测试 -300 曲线优化器。超过-300,对电压或频率没有进一步的影响。
在华硕 ROG BIOS 中,您可以通过 Extreme Tweaker Precision Boost Overdrive 子菜单访问 Precision Boost Overdrive 设置。或者,您也可以使用 AMD 超频菜单中的 Precision Boost Overdrive 子菜单设置。
超频模式
除了使用 Precision Boost Overdrive 进行超频外,AMD Ryzen CPU 还为超频玩家提供直接控制 CPU 工作电压和频率的工具。这被非正式地称为“OC 模式”。启用 OC 模式后,所有自动频率提升和省电技术将被禁用。
人们可能会质疑手动超频 AMD Ryzen CPU 的用例。就像所有过去的 Ryzen 处理器一样,手动超频的主要缺点是您失去了 Precision Boost 技术在低线程基准测试应用中产生高频的优势。因此,虽然 7950X 可以通过 Precision Boost 提升至 5700 MHz,但在手动超频时它将仅限于您设置的固定频率。
然而,手动超频并不全是负面的,甚至还有一些好处。
自动超频和频率提升技术留下了一些余地。在手动超频时,我们可以利用这个余量并微调应用程序和系统特定的稳定性。
在 AMD Ryzen CPU 上,您可以单独设置每个 CCX 的频率。因此,我们可以利用以下事实:某些 CCX 可能比其他 CCX 超频得更好。这对于 Ryzen 9 7950X 和 7900X 尤其重要。
通过设置固定电压,我们可以避免 CPU 动态快速地向 VRM 控制器更新其 VID 请求。这减轻了 VRM 上的压力,通常会产生较低的温度。
最大频率取决于您所需的稳定性水平和压力测试工具的选择。
在华硕 ROG BIOS 中,您可以通过 Extreme Tweaker CPU Core Ratio (Per CCX) 子菜单配置手动 CPU 超频。或者,您可以在 AMD Overclocking 手动 CPU 超频子菜单中手动调整 CPU 核心频率。
ECLK异步模式
值得提醒的是,Raphael还支持三种时钟发生器模式:内部时钟、外部时钟同步、外部时钟异步。调整参考时钟还可以帮助超频 CPU 内核,特别是在异步模式下使用外部时钟时。
在异步模式下,有两个不同的外部 100MHz 参考时钟。一个时钟为 CPU PLL 提供 100MHz 输入,另一个时钟为 SOC PLL 提供 100MHz 参考时钟。这意味着您可以独立于 CPU 的其他部分来增加 CPU 内核的参考时钟。当使用 Precision Boost Overdrive 或 OC 模式进行微调时,这可能会派上用场。
在ASUS ROG BIOS中,您可以通过设置Ai Overclock Tuner来选择时钟发生器模式。如果设置为自动,则使用内部时钟发生器。如果设置为手动,则使用外部时钟发生器。您可以为外部时钟发生器选择同步或异步模式。
CPU核心电压
CPU 内核电压由 VDDCR_CPU 内部电压轨提供,该内部电压轨由 VDDCR 外部电压轨供电。内部电压轨被旁路;因此,外部电压轨直接控制核心电压。
在使用 Precision Boost 的常规操作中,您无需调整该电压。但是,如果要在 OC 模式下设置手动超频,则必须直接配置电压。配置电压有两种方法:
配置“OCVID”,设置 CPU 将向电压控制器请求的 VID
配置VDDCR外部电压轨,直接配置电压控制器的输出电压

实际上,这两种方法没有区别。
在 ASUS ROG BIOS 中,您可以通过 Extreme Tweaker CPU Core Ratio (Per CCX) 子菜单配置 OCVID。或者,您可以在 AMD Overclocking Manual CPU Overclocking 子菜单中手动调整 OCVID。

在 ASUS ROG BIOS 中,您可以通过调整 CPU 核心电压设置,直接在 Extreme Tweaker 菜单中配置 VDDCR 电压轨。

AMD Raphael Infinity Fabric 超频
Infinity Fabric(有时称为可扩展数据结构)是 Raphael 封装上所有芯片之间通信的主要手段。封装上的每个芯片都有一组 GMI 链路(全局内存互连的缩写),CCD 通过这些链路与 IOD 进行通信。
无限结构频率和性能与内存子系统性能的性能调整最相关。由于 DDR5 内存控制器位于 IO 芯片上,如果 CPU 内核需要在 DDR5 内存中存储或检索数据,则必须通过 Infinity 结构到达 IO 芯片。
结构时钟
Fabric 频率或 FCLK 由 SOC PLL 生成,源自 100 MHz 参考时钟输入。参考时钟乘以 FCLK 比率,您可以在 BIOS 中配置该比率。

Infinity Fabric 的标准运行频率过去与内存控制器和系统内存是 1 比 1。然而,AMD Raphael 的情况有所不同。相反,Infinity Fabric 与系统内存和 CPU 内存控制器频率分离。默认情况下,它的运行频率为 1733 MHz。
仍然建议将结构时钟与系统内存和内存控制器频率同步运行,以提供最佳性能点。与 Zen 3 一样,足够高的内存频率可以克服不同步运行带来的任何性能损失。然而,鉴于 DDR5 频率功能,我不建议过多关注同步运行所有内容,因为您不太可能能够
在华硕 ROG BIOS 中,您可以通过 Extreme Tweaker 菜单中的 FCLK 频率设置来配置结构频率。或者,您也可以在 AMD Overclocking Infinity Fabric 频率和分频器子菜单中调整频率。

织物电压
VDDG 电源电压通过集成稳压器从 VDDCR_MISC 电压轨导出,提供结构电压。总共有四个 VDDG 电压轨可用于手动调节:
CCD0-CCD VDDG:从CCD0发送到IOD的信号以此电压发送
CCD0-IOD VDDG:从IOD发送到CCD0的信号在此电压下发送
CCD1-CCD VDDG:从CCD1发送到IOD的信号以此电压发送
CCD0-IOD VDDG:从IOD发送到CCD1的信号以此电压发送
请注意,VDDG 电压不会随 VDDCR_MISC 自动调整。因此,如果您需要增加 VDDG,例如支持更高的内存频率,则需要手动更改它。

在 ASUS ROG BIOS 中,您可以在 Extreme Tweaker 菜单中配置 VDDCR_MISC。或者,您可以通过访问 AMD Overclocking VDD Misc l 子菜单来调整电压。

在 ASUS ROG BIOS 中,您可以通过访问 AMD 超频 VDDG 电压控制子菜单来配置 VDDG 电压。

AMD Raphael 内存控制器超频
AMD Raphael 有两个 DDR5 统一内存控制器(简称 UMC)。每一个都包含一个存储通道。内存控制器位于 IO 芯片中。虽然 Zen 4 内存控制器在技术上应该支持 DDR4,但 AMD 已澄清 AM5 平台将仅支持 DDR5 内存。
内存控制器时钟
统一内存控制器频率或 UCLK 源自 SOC PLL 之一的 UMCCLK。UMCCLK 由源自内部或外部时钟发生器的 100 MHz 参考时钟驱动。
内存控制器频率直接与系统内存频率相关。它可以以其相同或一半的频率运行。默认情况下,内存控制器的运行频率与系统内存相同,均为 2400 MHz。不过,理论上,在运行 DDR5-12000 时,您可以将其提高到 6000 MHz。

在华硕 ROG BIOS 中,您可以通过内存频率设置来配置内存控制器频率。您可以通过访问 AMD Overclocking Infinity FabricFrequency 和 Dividers 子菜单并设置 UCLK DIV1 模式,强制内存控制器以内存频率的一半运行。

内存控制器电压
内存控制器电压由 VDDCR_SOC 电压轨提供。您可能需要提高电压以提高系统内存频率。这还将增加由 VDDCR_SOC 电压轨供电的其他 IP 模块(例如 SMU 和 PSP)的电压。

在 ASUS ROG BIOS 中,您可以通过调整 CPU SOC 电压设置来配置 VDDCR_SOC 电压轨。或者,您可以更改 AMD 超频 SoC 电压子菜单电压。

AMD Raphael 内存超频
Raphael 是 AMD 首款支持 DDR5 内存的 CPU。虽然从 DDR4 到 DDR5 似乎是一个重大的技术飞跃,但超频过程与以前的 AMD 平台类似。
还有两个与内存时钟相关的新功能:EXPO 和 DDR On The Fly。
DDR5 内存时钟
DDR5 内存频率或 MCLK 源自 SOC PLL 之一的 UMCCLK。UMCCLK 由源自内部或外部时钟发生器的 100 MHz 参考时钟驱动。
在不调整参考时钟的情况下,您可以将内存控制器频率设置为 1000 MHz、1200 MHz 或 1600 MHz,然后在 1600 MHz 和 6000 MHz 之间每 100 MHz 步进。一直到 DDR5-12000。

在华硕 ROG BIOS 中,您可以通过内存频率设置来配置内存频率。或者,您可以在 AMD Overclocking DDR Timings Configuration 子菜单中通过调整 Memory Target Speed 设置来设置内存频率。

DDR5 内存时序覆盖
当然,Raphael 还支持覆盖 DDR5 内存时序,因为这对于提高内存性能至关重要。以下是支持的内存时序列表:
DDR SPD 时序:
Tcl:CAS 延迟 (tAA)
Trcd:RAS 到 CAS 延迟时间 (tRCD)
Trp 最小行预充电延迟时间 (tRP)
Tras:最小活动到预充电延迟时间 (tRAS)
Trc:最小活动到活动/刷新延迟时间 (tRC)
Twr:最小写入恢复时间 (tWR)
Trfc1:最小刷新恢复延迟时间 (tRFC1)
Trfc2:刷新恢复延迟时间 (tRFC2)
TrfcSb:刷新恢复延迟时间 (tRFCsb)
DDR 非 SPD 时序
Trtp:读取 CAS# 以预充电延迟 (tRTP)
TrrdL:激活到激活延迟时间,同一组组(tRRD_L)
TrrdS:激活到激活延迟时间,不同的组组(tRRD_S)
Tfaw:四个激活窗口时间 (tFAW)
TwtrL:最小写入读取时间,相同存储体组 (tWTR_L)
TwtrS:最短写入读取时间,不同存储体组 (tWTR_S)
TrdrdScL:读取到读取延迟,相同的片选,相同的存储体组
TrdrdSc:读取到读取延迟,相同的片选,不同的存储组
TrdrdSd:读取到读取延迟,相同 DIMM
TrdrdDd:读取延迟,不同 DIMM
TwrwrScL:写入到写入延迟,相同的片选,相同的存储体组
TwrwrSc:写入到写入延迟,相同的片选,不同的存储组
TwrwrSd:写入延迟,相同 DIMM
TwrwrDd:写入延迟,不同 DIMM
Twrrd:写入读取延迟
Trdwr:读到写延迟

在 ASUS ROG BIOS 中,您可以在 Extreme Tweaker DRAM Timing Control 子菜单中访问内存时序。或者,您还可以在 AMD Overclocking DDR SPD Timing 和 DDR non-SPD Timing 子菜单中访问内存时序。

DDR5内存电压
我们已经知道,DDR4 和 DDR5 在内存供电电压方面存在显着差异。在 DDR5 内存上,大部分电压调节通过 PMIC 在模块上进行。PMIC 代表电源管理集成电路。
DDR5 PMIC 有两种输入电压:5V 和 3.3V。该规范还定义了 4 个 2 倍 VDD、VDDQ 和 VPP 的开关输出稳压器,以及 2 个 1.8V 和 1.0V 的 LDO 输出。
电源电压为1.1V
VDDQ 为 1.1V
VPP为1.8V
PMIC还具有许多其他功能,例如I2C和I3C、过压和过温保护等。每个 DDR5 棒都有自己的 PMIC,因此您可以在棒上运行不同的电压。幸运的是,大多数主板都允许您同步内存模块的电压。

还有一种与内存相关的电压由 CPU 调节,即 VDDP_DDR 电压。VDDP 是 DDR5 总线信号的电源电压,源自 VDDIO_MEM_S3 电压轨。根据定义,VDDP 应始终比 VDDIO_MEM_S3 电压低 100mV。
虽然 VDDP 源自 VDDIO 电压轨,但它不会随电压轨自动调整。因此,如果您想更改 VDDP,则必须通过 BIOS 选项手动执行此操作。当然,主板供应商可以实现自动规则以方便电压配置。

在华硕 ROG BIOS 中,您可以在 Extreme Tweaker Advanced MemoryVoltages 子菜单中访问 DDR5 内存电压。VDD 和 VDDQ 也可在 Extreme Tweaker 主菜单中找到。或者,您可以在 AMD VDDIO 电压控制和 VPP 电压控制子菜单中访问 DDR5 内存电压。

在 ASUS ROG BIOS 中,您可以在 Extreme Tweaker 子菜单中配置 VDDIO_MEM_S3 和 VDDP_DDR 电压轨。或者,您可以在 APU VDDIO 调整选项下的 AMD 超频 VDDIO 电压控制子菜单中调整 VDDIO_MEM_S3 电压,并在 AMD 超频 VDDP 电压控制子菜单中调整 VDDP_DDR 电压。

AMD 超频扩展配置文件 (EXPO)
AMD 超频扩展配置文件(AMD EXPO)旨在为支持 DDR5 内存的 AMD 平台提供无处不在的内存超频配置文件。其目的是允许内存供应商将高于 JEDEC 性能的配置文件编程到内存条的 SPD 上。然后,用户可以通过 BIOS 中的单个选项启用这些设置。结果是,客户只需单击一个按钮即可释放其全部内存性能。
如果这听起来很熟悉……那是因为它确实如此。
这并不是 AMD 第一次涉足高性能内存规范。2012 年,AMD 推出了适用于 DDR3 内存的 AMD Memory Profile(AMP)。有些人可能还记得 AMD 发布了自己的 Radeon 内存条!
最初,该标准不应该被命名为 EXPO,而是 RAMP。RAMP 代表 Ryzen 加速内存配置文件。不幸的是,商标问题可能阻止 AMD 使用该名称。
AMD EXPO 有 5 个主要部分:一个部分用于一般 EXPO 信息,两个部分用于两个 EXPO 配置文件,一个部分用于 CRC,以及一个用户配置文件部分。每个 EXPO 配置文件都有两部分:一部分包含强制参数,另一部分包含可选参数。
一般 EXPO 部分有几个可配置字段:
世博会识别字节
世博版
EXPO 配置文件 DIMM 配置(哪些配置文件处于活动状态以及每个通道支持多少个 DIMM)
EXPO 可选块支持:如果任一配置文件已解锁可选参数。
EXPO Profile 强制部分包括以下参数:
电压:VDD、VDDQ、VPP
DDR 数据速率:tCKAVG
DDR SPD 时序:tAA、tRCD、tRP、tRAS、tRC、tWR、tRFC1、tRFC2、tRFCsb
EXPO Profile 可选部分包括以下参数:
DDR 非 SPD 时序:tRRD_L、tCCD_L、tCCD_L_WR、tCCD_L_WR2、tFAW、tWTR_L、tWTR_L_WTR、tWTR_S、tRTP
截至录制时,AMD EXPO 似乎是一个自我认证计划,内存供应商可以声称已为 EXPO 做好准备。EXPO 规范概述了运行 memtest 和 3DMark 八小时的最低稳定性要求。此外,还应执行 50 周期重启测试,以确保 ACPI 状态转换稳定性。
预计未来将增加进一步的测试和验证要求。
由于 EXPO 验证方法仍然相当初级,因此预计最初会存在一些与稳定性相关的挑战。很大程度上取决于主板和内存供应商是否愿意执行广泛的兼容性和验证测试。虽然我们预计问题会随着时间的推移而得到解决,但请注意,在发布时购买 AM5 Raphael 时,您可能必须接受早期采用者价格。
在 ASUS ROG BIOS 中,您可以通过调整 Ai Overclock Tuner 设置来启用 Extreme Tweaker 菜单中的 EXPO。EXPO I 将仅加载内存主要时序、内存频率和内存电压。其余的配置文件计时将被华硕主板自动规则忽略和调整。EXPO II 还将加载完整 EXPO 配置文件的其余部分。
DDR 动态超频模式
AMD Ryzen 的一项新功能是能够在操作系统中自动超频系统内存。此功能称为“DDR On the Fly OC 模式”,可在安装并启用 AMD EXPO 内存的系统上使用。
DDR On The Fly OC 模式仅在明确启用时才处于活动状态。启用后,备用 DF Pstate 用于存储不同的 EXPO 配置文件。启动时,CPU 将训练各种内存配置文件。这确保 CPU 可以在运行时动态更改 P 状态以改变内存性能。
虽然 AMD BIOS 中提供了 DDR On The Fly OC 模式,但不幸的是,在撰写本文时我无法使其工作。我可以启用该功能,但系统无法完成POST,导致需要清除CMOS。此功能可能适用于其他主板、BIOS 或不同的内存。
在 ASUS ROG BIOS 中,您可以在 AMD Overclocking DDR Timing Configuration 子菜单中启用 DDR On The Fly OC Mode。导航至 DDR 和 Infinity Fabric 频率/时序子菜单,然后导航至 DDR 选项,然后访问 DDR 时序配置子菜单。您可以在此处即时启用 DDR。
内存上下文恢复
由于这是AMD首次涉足DDR5内存,毫无疑问,上市时会存在内存超频和稳定性问题。虽然内存超频应该会在发布后的几周和几个月内有所改善,但我预计早期采用者将面临一些困难。
为了增加内存超频成功的机会,我建议禁用名为“内存上下文恢复”的内存控制器选项。
内存上下文恢复启用或禁用每次启动时强制 DRAM 重新训练。训练是一个 DRAM 过程,旨在优化 CPU 内存控制器和 DRAM 内存芯片之间的信号完整性。更好的信号完整性意味着更高频率下更好的稳定性。记忆训练可能是一个漫长的过程。因此,为了提高系统的启动速度,BIOS 例程通常会跳过某些部分甚至整个过程。
我发现禁用此选项,从而在每次启动时强制进行 DRAM 训练过程,可以显着提高更高频率下的内存稳定性。遗憾的是,它还延长了启动过程。
在 ASUS ROG BIOS 中,您可以在 Extreme Tweaker DRAM Timing Control 子菜单中禁用 Memory Context Restore。
AMD Raphael 集成显卡超频
AMD Raphael 的全新之处在于,桌面 Ryzen CPU 现在也具有集成显卡。虽然这在技术上使其成为 APU,但 AMD 仍将其称为 CPU。APU 与 APU 有几个关键的区别。
首先,图形核心集成到 IO 芯片中。这是一个独立于 CPU 核心芯片的芯片。这与 APU 不同,APU 中的所有内容都集成到单个芯片中。
其次,Raphael 上的图形不适合运行任何类型的 3D 负载。当然可以,但性能很糟糕。
由于集成显卡不适用于任何 3D 工作负载,因此当前不支持对集成显卡进行超频。未来不太可能得到支持。
华硕 ROG Crosshair X670E 基因超频技术
华硕AI超频功能
华硕在其 Z490 ROG 主板上引入了 AI 超频作为下一代自动超频技术(请参阅SkatterBencher #10)。从那时起,它就出现在每一个英特尔平台上。但是,不适用于任何 AMD 平台。AM5 Raphael 改变了这种情况。
华硕AI超频采用独特的自动超频策略。该系统不是使用预设的频率和电压配置文件,而是在整个初始测试阶段监控 CPU 和冷却系统。然后根据其发现预测最佳设置。系统自动引导超频过程并调整电压和频率以匹配您的冷却系统。
散热越好,AI 超频就越高。
除了自动超频之外,AI Overclocking还在AI Features菜单中提供了很多高级信息和建议。该信息包括:
每个CPU核心的P0 VID和SP值
Precision Boost Overdrive 2 建议超频参数
Dynamic OC Switcher 建议超频参数
SP 值基于最大升压频率、温度和 P0 VID 的组合。一般来说,它表示特定核心的质量。SP 值越高,表明核心质量越好,超频能力越强,但这并不是一门精确的科学。超频建议基于对 CPU 散热解决方案的持续评估。
在 ASUS ROG BIOS 中,您可以在 Extreme Tweaker AI Features 子菜单中访问 AI 超频信息。
开始使用人工智能超频的最简单方法是首先在操作系统中运行一堆繁重的全核工作负载。这将有助于主板评估您的散热解决方案。然后,返回 BIOS 并按 F11。按照说明进行操作,然后单击启用 AI。
华硕动态超频切换器
Dynamic OC Switcher(简称 DOS)是华硕在超频 AMD Ryzen 处理器时解决核心挑战的巧妙方法。它首次随华硕 ROG Crosshair VIII Dark Hero 主板推出(参见SkatterBencher #27),此后已包含在其他几款华硕主板中。
从 Raphael CPU 超频概述中我们知道,AMD Ryzen CPU 核心超频有两种方法:Precision Boost Overdrive 和 OC 模式。
Precision Boost Overdrive 的优点是保留所有自动提升算法,包括峰值单线程频率和相关性能。
OC 模式可实现最大稳定全核频率的精确每 CCX 微调。
因此,您通常必须在最佳单线程性能或最佳多线程性能之间做出选择。
华硕动态超频切换器为我们提供了两全其美的功能,允许系统在运行时在 Precision Boost Overdrive 和手动超频模式之间主动切换。最容易将 DOS 概念化为保留所有自动 Precision Boost 优势,但为全核心工作负载手动配置频率下限。
DOS 几乎不需要额外的配置工作。我们需要知道两件事:
我们允许的最低频率是多少
我们希望DOS什么时候在PBO和OC模式之间切换
遗憾的是,我们不能简单地配置最低频率并根据该频率进行系统切换。相反,我们需要使用代理指标:特定的电流或温度阈值。
在 ASUS ROG BIOS 中,您可以在 Extreme Tweaker CPU Core Ratio (Per CCX) 子菜单中访问 Dynamic OC Switcher 设置。

没有确定完美阈值的具体方法,因此我将向您展示一个使用不带 AVX 的 Prime95 的示例。
第一步是确定您想要的手动超频。达到这一点的最快方法是选择您选择的压力测试工具,找到热预算内的最大 CPU 电压,然后找到该电压和温度的最大稳定频率。就我而言,我使用以下设置:
压力测试:Prime95 非 AVX
OCVID:1.25V(负载下1.12V)
负载线:5级(主板自动规则)
温度:90C,低于 TjMax 95C
频率:5325 MHz(CCX0 = 5350 MHz,CCX1 = 5300 MHz)
我们可以记下设置并切换回使用 Precision Boost Overdrive 进行调音。
下一步是应用所有 Precision Boost Overdrive 调谐设置,包括任何自定义曲线优化器或 Fmax Override 设置。就我而言,我使用以下设置:
PPT、TDC、EDC = 1000(主板自动规则)
F最大偏移 = +200
曲线优化器 = -15

然后进入操作系统并打开压力测试工具和 HWiNFO。我们的目标是找到 Precision Boost 频率低于我们目标手动超频 5325 MHz 的位置,并检查当前使用情况。在 HWiNFO 中,我们将监控 CPU 核心时钟和 ASUS EC VRM Vcore Current。
然后我们开始Prime95非AVX压力测试并在任务管理器中将亲和力更改为1个核心。现在监视核心时钟频率。它将高于我们 5325 MHz 的目标。
现在您可以逐渐增加活动线程数。当您达到 5325 MHz 或更低时,请检查 ASUS EC VRM Vcore Current 读数。该值将作为 DOS 当前阈值设置的输入。
在我的例子中,我们在 6 个活动线程下达到 5325 MHz 的频率,电流读数约为 67A。
现在我们可以返回 BIOS,将手动超频设置添加到已经处于活动状态的 Precision Boost Overdrive 设置中,并配置动态超频切换器。就我而言,我将切换到 OC 模式的电流阈值设置为 67A。
因此,重申一下正在发生的事情:当 CPU 电流达到 67A 时,Dynamic OC Switcher 将主动在 OC 模式和 Precision Boost 之间切换。任何高于 67A 的设备均采用手动 OC 模式;任何低于 67A 的电流都会启用 Precision Boost。

华硕电压暂停
电压暂停也不是一个新功能,因为它首次在 Crosshair VIII Extreme 主板上引入(SkatterBencher #29)。虽然它是一个相对高级的调整功能,但我发现它对于在使用 Precision Boost Overdrive 时最大化全核心频率特别有用。
悬架一词类似于汽车悬架,但我更喜欢更专业的术语“V 形夹”。V-Clamp 的目的是强制核心电压保持在特定范围内,即使使用动态电压(例如 Precision Boost Overdrive)也是如此。
为了实现这一点,主板 PCB 上的专用硬件电路允许嵌入式控制器读取当前的 CPU 温度和芯片感应电压。然后控制器指示电压控制器根据我们自定义的暂停规则调整电压。

我们可以通过设置电压上限和下限来配置电压暂停。
显然,上限是我们的最大电压,下限是我们的最小电压。我们可以以静态模式或动态模式配置天花板和地板。
在静态模式下,我们设置最大和最小电压。电压暂停功能将尝试将电压保持在这两个电平之间。
在动态模式下,我们制作自己的电压频率曲线,但我们不使用频率作为参数。相反,我们将上限电压和下限电压配置为由电压和温度定义的四个点的函数。所以,我猜它更像是电压温度曲线。

BIOS 中的情况有点复杂,但可以归结为:
上限值决定允许电压的最大上限
下限值决定了允许电压的最小下限
Cold Temp 设置较低的温度目标;较低通常意味着工作负载较轻,活跃核心较少
Hot Temp 设置上限温度目标;更高通常意味着所有核心都处于活动状态的繁重的多线程工作负载
VMin 电压根据高温目标进行映射
VMax 电压根据冷温目标进行映射

也许理解该功能的最佳方式是通过示例。我们采用以下参数:
最低最低 Vmin:1.05
地板热温度:95
最低最低电压:1.30
地板冷温度:50
上限低 Vmax:1.20
天花板高温:88
最高上限 Vmax:1.45
天花板冷温度:65
现在让我们将这些参数放入电压温度曲线中,其中 x 轴为温度,y 轴为电压。我们在图表上标记四个点,然后连接两个上限点和两个下限点。现在我们有了电压与温度的函数关系的线性比例曲线。
线性缩放意味着电压悬浮限制了温度范围的上下滑动。例如,假设温度为 75 摄氏度。在这种情况下,电压上限电压将为约1.35V,电压下限将为1.15V。
请注意,缩放不会线性持续,但上限和下限是电压目标的上限和下限。所以,1.45V是65摄氏度及以下的电压上限。而1.20V是88摄氏度及以上的电压上限。这同样适用于底电压。
移动这四个可配置点将根据您的需要改变电压温度缩放。

请注意,电压暂停仍然受到 CPU VCore 负载线的影响,并且不会影响任何下冲或过冲。提醒一下:电压暂停的目的是调整 CPU 请求的电压,使其保持在预先定义的上限和下限内。负载线的任何影响都会在重新调整后发生。

我发现了五种情况,电压暂停可以有效帮助您在超频时获得更高的性能。
提高最大超频频率
增加峰值有效时钟
缓解激进的曲线优化器设置引起的不稳定
提高繁重的多线程工作负载的温度、稳定性和频率
缓解从全核重负载到空闲再返回的快速波动造成的不稳定
首先,显而易见的是:当您使用参考时钟增加 PBO 频率时,您将需要更高的电压来确保稳定性。您可以使用更高的上限电压来获得比 Precision Boost 请求更高的电压。这可以帮助您稳定超频。
其次,您可以通过使用电压上限调整最大电压,为轻量工作负载实现略高的峰值有效时钟频率。起点是首先检查峰值电压,然后使用动态上限 Vmax 逐步降低它。使用我们的手动上限限制峰值电压可能会触发 CPU 检测到给定频率的电压太低并增加请求的 VID。这可能有助于将频率稍微提高一些。当然,您必须仔细检查时钟拉伸,因为调整电压可能会导致不稳定。
第三,您可以使用电压暂停来减轻运行激进的曲线优化器设置时的不稳定性。如您所知,曲线优化器允许我们操纵每个 CPU 内核的电压频率曲线。当使用负曲线优化器设置时,Precision Boost 算法将在给定频率下使用较少的电压。或者,当然,在给定电压下实现更高的频率。
但电压过低会导致不稳定。您可以配置下限 Vmax,以便轻负载时电压不会降至某个水平以下。
电压暂停的第四个应用是我发现最有帮助的一个。即减轻使用电压偏移对繁重工作负载稳定性的影响。一个很好的例子是我在 SkatterBencher #39 中将电压悬浮与 Ryzen 7 5800X3D 处理器结合使用。在我的第二个超频策略中,我使用参考时钟和电压偏移来实现更高的峰值频率。这增加了负载下的电压。使用电压暂停,我可以降低有效工作电压,并在全核 Prime95 工作负载下实现约 200 MHz 的更高频率。
最后,您可以使用电压暂停来减轻瞬态负载的影响。在某些情况下,您可能会发现工作负载在满载和空载之间快速切换。负载差异及其对有效电压的影响可能会导致系统不稳定。您可以尝试通过设置适当的电压下限来缓解此问题。
在华硕 ROG BIOS 中,您可以访问 Extreme Tweaker DIGI + VRM 子菜单中的电压暂停选项。
华硕自定义算法
自定义算法是一项全新功能,允许您根据自己的意愿修改精度提升行为。该函数的工作原理类似于“If This then That”,系统监视是否满足特定条件,然后采取指定的操作。
共有三种可用算法。对于每个算法,您可以指定要监视的条件、定义条件状态的两个阈值以及每个条件状态的 3 个操作。
有以下三个可用条件:
中央处理器温度,
核心电压,和
核心电流
对于每种条件,您都有三种状态:低于 1 级、介于 1 级和 2 级之间以及高于 2 级。条件测量单位为 CPU 温度的摄氏度、核心电压的毫伏和核心电流的安培。
系统将根据监控条件的当前状态采取行动。
有八种可用操作:
快速封装功率限制(PPT Fast),
封装功率限制慢速(PPT Slow),
热极限(THM),
Vcore TDC 限制(CPU TDC),
Vcore EDC 限制(CPU EDC),
SOC TDC 限制(SOC TDC),
SOC EDC 限值 (SOC EDC),以及
ECLK 异步 BCLK
对于这三种状态中的每一种,我们都可以设置一个操作。功率的单位是瓦特,温度的单位是摄氏度,电流的单位是安培,BCLK 的单位是 MHz。

我们举两个例子。
在我们的第一个示例中,我们希望利用这样一个事实:低温下的超频余量通常比高温下更好。因此,我们要根据CPU温度来调整参考时钟。在这种情况下,我们设置如下:
算法 1:启用
算法1 条件:CPU温度
算法 1 操作:ECLK ASynch BCLK
1级阈值:50
2 级阈值:80
1级行动值:105
2级行动值:103
3级行动值:101
这将产生以下效果:
当CPU温度低于50摄氏度时,参考时钟为105 MHz
当CPU温度在50到80摄氏度之间时,参考时钟为103 MHz
当CPU温度高于80摄氏度时,参考时钟为101 MHz。
这使我们的性能分别提高了 5%、3% 和 1%。

在我们的第二个示例中,我们担心当 CPU 温度非常高时 Precision Boost 会施加高电压。因此,我们要根据CPU电压来调整热限制。在这种情况下,我们设置如下:
算法 1:启用
算法1 条件:核心电压
算法 1 操作:热限制
1级阈值:1200
2级阈值:1300
1级行动值:85
2级行动值:75
3级行动值:65
这将产生以下效果:
当核心电压低于1.2伏时,热极限为85摄氏度
当核心电压在 1.2 至 1.3 伏之间时,热极限为 75 摄氏度
当核心电压高于1.3伏时,热极限为65摄氏度

在 ASUS ROG BIOS 中,您可以访问 Extreme Tweaker 自定义算法子菜单中的自定义算法选项。

ROG 真正的伏尔提西亚人
ROG True Voltician 首次在特定 ROG Z690 主板上推出,现在也可在 ROG Crosshair X670E Gene 和 Extreme 上使用。Voltician 一词是电压和光学仪器的组合。正如您已经猜到的,它是一个用于观察系统电压的工具。在 ROG X670E 主板上,有三个通道用于显示 Vcore、SOC 电压和 CPU 电流。
Voltician 是一款 USB 示波器。您可以直接在您的系统上使用它,也可以通过 USB 将其连接到第二个系统。这两个选项需要稍微不同的设置。
如果您想使用 Voltician 检查系统电压,只需将设备插入主板上可用的 USB 接头即可。然后将 3 通道输入连接到主板上的 OSC Sense 排针。
如果要将 Voltician 连接到单独的系统,您需要使用 micro-USB 电缆。然后,您需要将 Voltician 接地引脚连接到主板上的任意接地端。例如,使用 FAN 标头之一。



远程监控有两个主要好处:
即使目标系统关闭,您也可以继续监控电压
监控速度不受系统负载影响
默认情况下,Voltician 的电压范围为 0 至 3.3V。但是,使用不同的引脚配置,您还可以启用 0 至 5V 或 0 至 12V 范围。
您可以使用 ROG True Voltician Dashboard 应用程序来监控电压。仪表板有两个主要功能:示波器系统和数据分析。




您可以在示波器系统运行时监视三个通道。有多个选项可用于微调您的视图,以便您可以根据需要进行设置。
在数据分析中,您可以记录电压数据,将其导出到CSV文件,然后分析数据。
如何使用 Voltician 的一个示例是分析 CPU VRM 负载线的行为。在我的示例中,我将 CPU 倍率设置为 45X,CPU 电压设置为 1.15V,并且在所有内核上使用没有 AVX 的 Prime95 Small FFT。如您所见,LLC1 和 LLC8 之间的差异很大,LLC1 的平均电压为 0.933V,LLC8 的平均电压为 1.116V。选择正确的负载线可能意味着重负载下稳定性和不稳定之间的差异。

AMD Raphael 超频预期
我们可以将超频期望分为环境冷却和极限冷却。
对于环境超频,当使用具有高端定制循环水冷的 16 核 Raphael CPU 时,我期望获得以下最大超频结果。
1.50V 时为 6.0 GHz,1 核最大频率
1.45V 5.9 GHz,1 核游戏稳定频率
5.5 GHz @ 1.30V 八核游戏稳定频率
5.4 GHz @ 1.25V 全核游戏稳定频率
5.2 GHz @ 1.15V 全核最大稳定频率
全核 AVX-512 最大稳定频率为 5.1 GHz @ 1.05V
FCLK 最大稳定频率为 2.133 GHz
UCLK 最大稳定频率为 3.2 GHz
DDR5-6400 可实现最大稳定内存频率
VDDCR_SOC = VDD = VDDQ = 1.4V
175 MHz 参考时钟频率
这几乎是我在早期录制的测试会话之一中管理的超频。
因此,与 Ryzen 5000 Zen 3 Vermeer 相比:
单核频率范围增加 700 MHz
单 CCX 频率范围多 700 MHz
双 CCX 频率范围增加 600 MHz
双 CCX AVX 频率范围增加 700 MHz
结构频率具有类似的超频能力
内存控制器频率 1000 MHz
内存频率增加 1200 MHz
这些超频裕度也与我们所看到的极限超频相符。
AMD Raphael 超频示例
现在我们已经了解了 AM5 和 Raphael 超频的所有知识,我们可以进入实际部分了。我将首先回顾超频概念,然后展示一个实际示例。
超频概念
Raphael 提供了一系列令人难以置信的超频策略和机会。Ryzen 超频玩家已经熟悉 Precision Boost Overdrive 和 OC 模式的主要途径。现在有了异步 Eclk 形式的第三种途径。
使用 Precision Boost Overdrive 平台配置工具(如 PPT、TDC 和 EDC),这将使更高的频率保持更长时间
使用 Precision Boost Overdrive 处理器配置工具,例如 Fmax、Scalar 和 Curve Optimizer。
Fmax 增加了频率上限,允许在较轻的负载下使用更高的频率
标量降低了可靠性问题,允许使用更高的电压
曲线优化器偏移电压-频率-温度表,在给定频率-温度点强制降低电压,从而能够在给定电压下提升到更高频率
使用OC模式,可以让我们手动微调CPU工作在特定的电压频率点,而不管温度如何
使用带有 Precision Boost 的异步 Eclk,可提高特定电压-温度点的频率
Precision Boost Overdrive 和 OC 模式之间的权衡对于 Ryzen 超频玩家来说是众所周知的。虽然超频模式通常允许更精细和更高的全核心超频,但您会放弃较轻的较少核心工作负载的高频提升。随着Ryzen 7000更高的频率,全核和单核最大频率之间的差异可以达到500 MHz或更多。
异步 Eclk 向使用 Precision Boost Overdrive 的传统方法抛出了一个曲线球,因为它是曲线优化器的对立面。Curve Optimizer 将降低给定频率-温度点的电压,而 Eclk 将增加给定电压-温度点的频率。从逻辑上讲,调节一个旋钮会影响另一个旋钮的调节范围。
这使得找到最佳调整过程变得更加困难。我花了一些时间试图找到调整 Ryzen 7000 CPU 的最佳方法。我将详细介绍该过程,以便您也可以自己尝试一下,如果您愿意,可以在下面的评论中分享您的发现。
超频过程:基线
首先,我们要确立目标。
我们调整的目标是提高所有核心、工作负载类型和线程数量的最大频率、平均频率和最小频率。我使用 Shaamino 的一个工具,它可以测量 1 到 31 个活动线程的固定工作负载中所有活动核心的平均核心频率。
我们的基准配置启用了 Precision Boost Overdrive(释放 PPT、EDC、TDC)和 100 MHz Eclk。
请注意,我使用的是工程样本 CPU,因此升压频率与零售 CPU 不匹配。也就是说,一般调整过程仍然适用于零售 CPU。
基线频率以此线为特征,范围从 1 个活动线程时的 5398 MHz 到 31 个活动线程时的 5100 MHz。编程的 Fmax 为 5450 MHz,这意味着基本配置有效 Fmax 是编程的 Fmax 的 99%。这在以后很重要。平均频率为5200 MHz,最低频率为5100 MHz。
然后,我尝试了 Precision Boost Overdrive 处理器配置工具的三种变体:
曲线优化器所有内核均具有 -30 负偏移
上述,但增加了 +200 MHz 的 Fmax 偏移
与上述相同,但标量调整为 10X。
曲线优化频率范围从 1 个活动线程时的 5450 MHz 到 31 个活动线程时的 5293 MHz。编程的 Fmax 为 5450 MHz,这意味着基本配置有效 Fmax 是编程的 Fmax 的 100%。这就是我在下一个变体中添加 +200MHz Fmax 的原因。平均频率为 5365 MHz(高于基准值+165MHz),最低频率为 5293 MHz(高于基准值+193MHz)。
Fmax 调整频率范围从 1 个活动线程时的 5526 MHz 到 31 个活动线程时的 5304 MHz。编程的 Fmax 为 5650 MHz,这意味着我们的有效 Fmax 为 97.8%。平均频率为 5366 MHz(超过 CO+1MHz),最低频率为 5304 MHz(超过 CO+9MHz)。
不幸的是,标量调整对最大、平均或最小频率没有影响。
在下一步中,我尝试探索异步 eclk 提供的超频空间。对于三个变体(基础、曲线优化器和 fmax)中的每一个,我试图找到最大稳定的 Eclk。
基本情况为 106 MHz,曲线优化情况为 102.25 MHz,Fmax 偏移情况为 102.25 MHz。具有最大 Eclk 的基本情况提供最高的最大频率和平均频率。它与最小频率下的 Fmax Offset 情况相匹配。
Eclk 频率的基本情况范围为 1 个活动线程时的 5684 MHz 到 31 个活动线程时的 5436 MHz。编程的 Fmax 为 5777 MHz,这意味着我们的有效 Fmax 为 98.4%。平均频率为 5495 MHz(高于基准值+295 MHz),最低频率为 5421 MHz(高于基准值+321 MHz)。
然后,可以开始进一步的微调。下一步是找到 Eclk 和 Curve Optimizer 之间的最佳平衡点。我以负五为步长增加全核Curve Optimizer,并调整Eclk以确保稳定性。我发现最佳点是负 10 CO,Eclk 为 104.75 MHz。
最佳点频率范围为 1 个活动线程时的 5688 MHz 到 31 个活动线程时的 5430 MHz。编程的 Fmax 为 5736 MHz,这意味着我们的有效 Fmax 为 99.2%。平均频率为 5500 MHz(超出基准值+300 MHz),最低频率为 5430 MHz(超出基准值+330 MHz)。
超频过程:微调
最初的超频过程已经提供了良好的基线,但仍有很多工作要做。我们将在超频过程的微调部分中解决最大化频率的问题,同时保持各种应用程序的稳定性。
通过在每个核心的基础上微调曲线优化器设置,可以最大化频率。这将利用以下事实:某些内核可以比其他内核更好地超频。
确保稳定性将需要我们运行比我们在基线调整过程中使用的更广泛的基准测试和压力测试应用程序。基准测试应用程序范围从最轻的单线程工作负载到最苛刻的全核工作负载。没有一组明确的工作负载可供压力测试,因此您可以根据自己的解释自由定义稳定性。
就我而言,最轻的工作负载是 NOP Bench,最具挑战性的工作负载是启用 AVX 的 30 分钟 Prime 95 小型 FFT。我经常使用一组介于这两个极端之间的基准测试:Geekbench 5、Cinebench R23、CS:GO、3DMark、AI Benchmark 等。我对稳定超频的典型要求是我的系统必须能够运行所有这些连续的工作量。
关于 NOP Bench 的简单介绍。这是由Elmorlabs的 Elmor 编写的一个小应用程序。它本质上是通过运行 NOP 指令来加载 CPU 内核的。NOP是一条单字节指令,表示不进行任何操作。因此,实际上我们要求 CPU 尽可能快地不执行任何操作。在我看来,超频社区可能会认为这是一个更好的频率验证标准。
接下来,谈谈Prime95。我在让 AVX512 在最新的 Prime95 版本上运行时遇到了一些困难。所以,这一次,我将忽略我的要求,并使用不带 AVX 的 Prime95 Small FFT 作为最坏情况的压力测试。
经过几个小时的微调后,我们可以进入 BIOS 并配置我认为可能是典型的高性能超频的 Ryzen 9 7950X 工程样本和 EK-Quantum 定制循环水冷。
超频过程:示例
进入BIOS后
转到“极限调整器”菜单
将 Ai Overclock Tuner 设置为 EXPO I
将 eCLK 模式设置为异步模式
将 BCLK2 频率设置为 104
将 FCLK 频率设置为 2000 MHz
进入 Precision Boost Overdrive 子菜单
将曲线优化器设置为每个核心
将 Core 0 曲线优化器符号设置为负
将 Core 0 曲线优化器幅度设置为 20
将 Core 1 曲线优化器符号设置为负
将 Core 1 曲线优化器幅度设置为 20
将 Core 2 曲线优化器符号设置为负
将 Core 2 曲线优化器幅度设置为 20
将 Core 3 曲线优化器符号设置为负
将 Core 3 曲线优化器幅度设置为 5
将 Core 4 曲线优化器符号设置为负
将 Core 4 曲线优化器幅度设置为 15
将 Core 5 曲线优化器符号设置为负
将 Core 5 曲线优化器幅度设置为 15
将 Core 6 曲线优化器符号设置为负
将 Core 6 曲线优化器幅度设置为 20
将 Core 7 曲线优化器符号设置为负
将 Core 7 曲线优化器幅度设置为 10
将 Core 8 曲线优化器符号设置为负
将 Core 8 曲线优化器幅度设置为 5
将 Core 9 曲线优化器符号设置为负
将 Core 9 曲线优化器幅度设置为 10
将 Core 10 曲线优化器符号设置为负
将 Core 10 曲线优化器幅度设置为 20
将 Core 11 曲线优化器符号设置为负
将 Core 11 曲线优化器幅度设置为 20
将 Core 12 曲线优化器符号设置为负
将 Core 12 曲线优化器幅度设置为 5
将 Core 13 曲线优化器符号设置为负
将 Core 13 曲线优化器幅度设置为 20
将 Core 14 曲线优化器符号设置为负
将 Core 14 曲线优化器幅度设置为 10
将 Core 15 曲线优化器符号设置为负
将 Core 15 曲线优化器幅度设置为 0
将 Medium Load Boostit 设置为启用
将 Precision Boost Overdrive 设置为启用
将 CPU Boost Clock Override 设置为启用(正)
将最大 CPU 加速时钟覆盖 (+) 设置为 200
进入曲线优化器子菜单
离开曲线优化器子菜单
离开 Precision Boost Overdrive 子菜单
然后保存并退出BIOS。
这只是 Ryzen 7000 超频的初探。我将在未来的 SkatterBencher 超频指南中提供更详细的超频信息。
在库存中禁用 AVX 的情况下运行 Prime 95 Small FFT 时,平均 CPU 有效时钟为 4821 MHz,电压为 1.1 V。CPU平均温度为82.3摄氏度,平均CPU封装功率为207.8瓦。Precision Boost 算法受到 CPU TDC 的限制,其最大值为 160A。
在禁用 AVX 超频的情况下运行 Prime 95 Small FFT 时,平均 CPU 有效时钟为 5146 MHz,电压为 1.129 伏。CPU平均温度为95.2摄氏度,平均CPU封装功率为260.5瓦。Precision Boost 算法受到允许的最高 CPU 温度的限制。
结论
好了,本文就到此为止。