最新的ArmV9架构 规格与性能
Arm在今年三月发布了最新的Armv9架构,其中包括最新的“超大核”Cortex-X2,“大核”Cortex-A-710和“小核”A-510,今天我们就来了解一下最新的Armv9架构吧。

1,Cortex-X2超大核

Cortex-X2 是 Arm 第二世代的 Cortex-X系列,专用处理高负载的指令。据Arm说,Cortex-X2的单核性能相较上一代的Cortex-X1增加了30%,而相较于2020年搭载Arm架构的Windows 10和Chromebook的单核性能提高了40%。Arm表示最新的Cortex-X2可以达到16MB的L3级别缓存。但是功耗Arm并没有表示,应该很难说有可能功耗并没有下降。
2,Cortex-A710大核

Cortex-A710著重在能效比和持续性能
既然當前高效能核心的定位已經被 Cortex-X2 取代, Cortex-A710 就不再象徵追求最高性能的定位,但仍舊是 Arm CPU 微架構中的要角,在全新的產品定位做為負責主要主流級運算的性能核心,並強調針對持續高度工作負載具備最佳化的效率。
Cortex-A710相较Cortex-X2更注重能耗和持续性能,相较A78提升了10%的性能,还提升了30%的能效比。意味着在在日常使用中,续航会更持久。而且在深度学习中,提升了2倍。
3,Cortex-A510小核

Cortex-A510 相較 Cortex-A55 進步幅度相當顯著
相較於上一世代"大核" Cortex-A7x 系列微架構幾乎每年一度的改版,"小核" Cortex-A55 已經是 2017 年在 Computex 所公布的微架構,而此次大改版到 Cortex-A510 也有顯著的整體提升,在性能方面對比 Cortex-A55 提高 35% ,而在能源效率也提升 20% ,同時增加達 3 倍的機器學習性能。
同時 Cortex-A510 還具備一全新的創新技術,稱為合併核心微架構( merged core microarchitecture ),合併核心微架構能夠將 2 個 Cortex-A510 構成一個群組,單一個 CPU 可由多個群組構成,利用此彈性化的的結構設計能進一步提升單位面積效率與擴充彈性,簡單來說就是類似當前 AMD 的 CPU 是透過多個 CPU CCX 模組構成一顆大型 CPU 一樣。
雖然 Cortex-A510 定位在處理背景與輕度負載內容,但性能大幅提升之下,也等同具備 Cortex-A510 的處理器能夠在更多的應用僅需使用省電的 Cortex-A510 ,減少動用到 Cortex-A710 與 Cortex-X2 的時間,進一步提升整體效能;同時對於主要以 Cortex-A510 構成的中低階處理器也能具備更出色的性能但兼顧能源效率。


Armv9 的微架構將分為 Cortex-X 、 Cortex-A700 與 Cortex-A500 三大系列
在 Cortex 系列邁入 Armv9 架構, Arm 也將旗下的 CPU 微架構產品定位進行再調整,未來 Cortex-X 除了半客製化架構的身分,也兼具追求最高效能的超高效能核心;至於大核心 Cortex-A700 則重新定位於適合多核工作負載與能耗效率平衡,具備最佳持續性能的性能核心;小核 Cortex-A500 則繼續最佳能源效率應用,作為輔助大核 Cortex-A700 系列、性能核 Cortex-X 構成大小核設計,為處理瑣碎的背景與輕度負載作業而生。

在當前 Armv8 指令集時代所宣布的 DynamIQ 中,單一個 Cluster 可容納最多 8 核心、包括 4 個大核與 4 個小核;而 Armv9 所搭配的 DSU-110 雖在單一 Cluster 仍為 8 核心,不過卻可容納最多 8 個 Cortex-X2 高性能核心,這也意味著除了原本的行動運算級與入門筆電外, Armv9 為 Arm 架構進一步帶來跨足高效能 PC 領域的可能性。
從能源效率的角度,基於 DSU-110 的 DynamIQ 設計可自 4 個 Cortex-A510 、 2+6 大小核、 4+4 大小核到目前高階手機處理器的 1 + 3 + 4 組合外,針對更進階的主流效能筆電能提供 4 個 Cortex-X2 搭配 Cortex-A710 的組合,若將情境轉換到桌上型 PC 設備,甚至可藉由 8 核 Cortex-X2 搭配主動散熱帶來更驚人的性能。
DSU-110 使核心之間的頻寬提升達 5 倍,同時也進一步改善能耗與降低多核協作的延遲,並提供高效能運算配置最高 16MB 的 L3 ;另外在能源管理部分, DSU-110 減少 CPU Cluster 的能源耗損,同時在部分核心停止供電時仍可進行低強度的工作負載,此外搭配全新的 PPC 整合電源策略單元與多種省電模式提供更好的能源管理。

機器學習已是目前自行動裝置到 PC 都相當主流的技術,藉由導入 Armv9 指令集,此次宣布的 Cortex-X2 、Cortex-A710 與 Cortex-A510 可支援 BFloat 16 格式,矩陣運算能夠支援 Int8 、 BF16 與 SVE2 ,使得新世代的架構皆較前一代在機器學習有明顯的提升,尤以 Cortex-A510 更比起 Cortex-A55 在機器學習提高 3 倍性能。
总结:Arm终于把用烂的“万年A55”换掉了,也把大核换了,有可能在2022年的Arm处理器有着大幅度的提升,让我们尽情期待吧!!!