[ARK数据整理计划-特1] Xeon E3 v4/E3-1500 v5 可视化数据汇总表 主表 Rev 0.1

//这个表格虽然小,但是我设计得太复杂了,直接投学习区了。。知识点太多。。
主表 Rev 0.1 ReleaseNote (穿插有细致的数据分析与解读,甚至一些做表格的技巧,非常重要!!)
1. 表格采用上下分割的布局,而不是将公共属性(也就是同类项)置于左侧,或是分开两张表格等之前表格用过的方法。主要还是为了好看,清爽,又不影响表头的辨识度。中间的硬线很关键。
2. 共计16个型号按目标市场分开,Svr(Server)代表服务器,Emb(Embedded)代表嵌入式,Mob(Mobile)代表移动(其实就是笔记本)。对于任何产品都是性质决定用途、用途体现性质(欸怎么好像串词了),因此按照目标市场来划分CPU类型,对于归纳整理CPU的参数会有很大的帮助。(多说两句,其实这么多型号,都没有高低优劣之分,只有用武之地之别。满足目标市场需求就是好机器,多了就是性能过剩浪费资源。需求各种各样,才有了有了各种各样的产品,只不过这些产品不一定都符合我们的需求罢了。)我们可以发现,后缀为8L的是嵌入式CPU(这同样适用于E5),后缀为5(5/5L/5M)的是带核显E3的专门后缀。其实CPU的后缀除了包含最后的字母外,还包含字母前一位的数字。有时候这个数字对于参数的影响比字母更重要,尤其是对于E5和笔记本CPU。
3. SKU (short)是CPU型号的缩写,这也算是我的传统艺能了,相信大家都能自动脑补。斜体的型号代表官方ARK中没有的型号。内容为问号的数据是未知数据,内容为斜杠的数据为不可能存在的数据(LGA封装的CPU没有TJ温度(LGA的U有TCASE,不过那几个型号没有数据),Gen8的核显没有双精度)。
4. CPU Rate代表以GHz为单位的CPU基本和最大频率。为了将差距拉开方便比较,颜色拐点是这样设置的:红色到黄色是1.8-3.0,黄色到绿色是3.0-4.0。这是因为在3.0-4.0这个区间内,频率的变化最细致最丰富,这段的变化也是CPU之间的主要差距,也是我们主要关心的地方,因此给相对小的数据区间分配了一个相对大的颜色区间。而1.8-3.0这部分我们则不是很关心,因为在这个相对大一些的区间内,本来就没有多少数据,数据的变化也很跳跃,所以即使数据区间很大,也不需要给它很大的颜色区间。如果这太不够明显的话,GPU Rate的拐点是300-1000-1150,是体现上述原则最明显的一项数据。TDP的拐点是35-47-95,也比较明显,不过正好是反过来:35-47W变化最丰富。
5. 重头戏来了!这一段很长很复杂。
GPGPU(GPU通用计算)是Intel核显的长处,也是是衡量GPU性能的重要途径。关于内存拷贝的数据受驱动版本影响很大,且对实际使用参考价值相对不大,因此不包含在表格中。最终包含在表格中的数据有:单精度理论值(SP theory)、单精度(SP)、双精度(DP)、AES256加密(AES)、SHA1哈希校验(SHA)、单精度Julia测试(SPJ)、双精度Mandel测试(DPM)。其中,单精度理论值对于Gen8-9的核显来说是一个定值:0.0016GFlops每EU每MHz。(有点像IPC的简单定义:运算速度每频率每核心。)我们发现对于两代核显而言,这个值是相同的,那么如何衡量Gen9的进步呢?这个一会再提。
如此多种类的数据,单位也各不相同,如何用一个简单的方式来描述所有数据,而且还方便比较呢?
我们可以先找一找数据之间的关系。把这些数据分为三类:A.纯理论数据(SP theory);B.实测的理论数据(只是衡量GPU最大能运转得多快,但是是通过实际让CPU运转来衡量)(SP, DP);C.实测的实际数据(完成某种具体任务的速度)(AES, SHA, SPJ, DPM)。
于是容易得出,A在B中起主要作用;B在C中起主要作用。那么为了更简单地描述数据,我们就可以突出“A以外的因素对于B的影响”和“B以外的因素对于C的影响”。这个时候能采取什么手段呢?
其实很简单。在描述B时,取它与A的比值;在描述C时,取它与B的比值。这样除了那一个A之外,其他的数据就都可以用一个比值来表示了。即ΔSP=SP/SP(theory)(理想值为1), ΔDP=SP/DP(理想值为4,即Gen9的单双精度比), ΔAES=AES/SP, ΔSHA=SHA/SP, ΔSPJ=SPJ/SP, ΔDPM=DPM/DP。这样做还有一个好处,就是C的比值不受B的比值的影响。也就是说,比如说我的1585v5因为散热原因,性能只能发挥94%(这是表格中的实测数据),那么最后算出的C的Δ值,就不受那个94%的影响,可以放心地和上面的1283L v4的同一项目的Δ值比。
有了这些值,比较两代之间的差距也就容易了。我们知道既然理论值相同,进步肯定会体现在实际运算上。那么就从三个两代都有的C入手。令λAES=(ΔAES1-ΔAES2)/ΔAES1,其余两项以此类推。我们就以表格上已有的83L v4和85 v5的数据为例。计算得λAES=9.73%, λSHA=5.16%, λSPJ=19.18%。这三个值就是Gen9在这些项目上领先的百分率了。
//讲了这么半天,逻辑也不是很清楚,让人半懂不懂的。你们就当我是胡说八道吧,我也没了解过别人是怎么处理这些数据的,我的这种土办法不一定对,对了也不一定是好办法。我主要是害怕你们看到我说得很多很绕,就觉得我说的是对的。
6. 在本表中,83L v4是唯一一个斜体型号。它是第一代Intel VCA视频加速卡内置的CPU,之前它的参数是无解的,本表可能是它的参数首次被公布。它的主要参数与84L v4完全一致,可以视为84L v4的BGA版。(多说两句,最早听说VCA的时候,我还以为Intel会用嵌入式的78L等型号。由表可知,嵌入式型号的特点很明显:CPU基本频率较低,GPU基本频率比较高。这样在散热条件差的情况下,核显性能就能优先被保证。至于VCA为什么没用78L,估计是考虑到进机房的服务器也不像嵌入式环境那样散热差。虽然VCA内置CPU的TDP都只有50W左右,VCA的整体TDP却标到了235W。TDP不等于功耗,但与散热系统直接相关。有235W的散热能力的地方,也就不需要考虑先保CPU还是GPU了。另外VCA除了视频处理以外,还有一个重要功能:桌面虚拟化,可以理解为GPU强化的虚拟机。都开虚拟机了,CPU性能也就变得同等重要。)
7. 本表中还有一个比较特殊的型号:70L v4。按照命名规则,0这个后缀在E3中代表无核显。但是ARK根本没有提这个型号的任何有关核显的信息,只是说eDRAM=128MB。所以我怀疑这个型号是核显损坏被屏蔽的CPU,eDRAM只作为L4用。(另外,Gen9核显以后的eDRAM虽然起着比L4更好的作用,但是严格意义上讲不算是L4。这个贴吧有大佬讲过。)