论兆芯的提升:从兆芯C到兆芯D(国产X86能自主设计架构吗?)
前作:论兆芯的提升:从兆芯A到兆芯C(国产X86技术源自何方)
本作主要论证从兆芯C到兆芯D(KX5000)的提升以及国产X86是否能自主设计架构
官网参数:



简单来说,兆芯KX5000系列处理器产品是兆芯在几步走方案里面的第三步

兆芯官方的定义是主要实现了内核性能优化(更换架构)提高多核芯片的整体性能(堆核,原生八核)解决访存带宽瓶颈(取消南北桥与FSB总线)以及支持了DDR4内存,相比前代的提升是明显可见的,主要完成的是向全集成化解决方案迈进,性能的提升反倒是次要的。
当然实际上这个问题还是存在的。KX5000在完成前主工程师离职,因此很多部分还没有完成不得不以半成品的形式发布,实际上19年发布的KX6000才应该是五道口架构的完全版,原计划KX6000应该只是KX5000的换工艺版但是实际上由于半成品的原因所以KX6000也做了很多原本应该在28nm节点就完成的修改

从图片可以看到KX5000的核心面积相当大,基本赶上了AMD的早期四核了(AM3 FM1之类的),至于IPC提升25%咱只希望是咱不能简单理解为同频性能的IPC,因为实际跑分(象棋)来看同频性能相比兆芯C只提升了10%,并没有那么多,包括KX5000的内存访问带宽也没有提升那么高,这些都是跑分中能实际看出来的问题


无论是使用集显独显单通道双通道内存,读写跑分都只有10G左右的水平,实际相比兆芯C+的提升也就25%-40%那样吧
PPT上宣传的这个提升实际上要到KX6000才能实现,所以咱看来可能还是因为是有半成品的原因存在吧。没准按照KX6000的水平制造28nm版本就能达到宣传了也说不定

至于CPU架构和互联结构雀食换了,流水线从20级缩短到了15级,少了5级,这对于超频比较不利但是有利于提升同频性能,实际上三发射改为双发射精简了核心这里没提,但是精简核心会降低核心面积的同时降低同频性能,因此需要靠提升能效堆核来解决整体性能问题消除劣势。至于改进分支预测与乱序执行这些都暂且不提,都是提升同频性能比较常见的操作。

可以看到相比兆芯C+的胶水双四核的八核明显是更加科学合理的设计,四核为簇内部点对点外部使用IF总线簇间连接,四核一簇这对于小核心来说是很常见的结构,英特尔现在的大小核或者纯小核就存在这个结构,而华为的鲲鹏920也使用了四核为簇然后多簇之间之间用环形总线连接的结构,它们都能有效的实现多核互连因此多核效率是不存在问题的。


话虽这么说胶水核心也不是不能用,就是对北桥的负载会高些核间延迟也会高些,但是全核整体性能的提升还是有的,英特尔当年在775时代就用胶水四核打赢了AMD的真四核,所以凡是不能绝对,如果胶水没用也就不会出了。




兆芯在C+时代胶水八核之后发布了ZX-100S芯片组,其中包括集成集显C320和不含集显的两种型号


从图片上来看,我们明显可以发现ZX100S相比原S3大陆团队(后来的兆芯初始团队)设计的VX11H芯片组的面积更大、功耗更高,内存支持更高扩展接口更多。后者可以认为是常规升级,前者的提高明显不像正向升级,考虑到兆芯C+ FC1080胶水核心的存在可能就好理解了,胶水核心由于数据交换经过北桥会显著提升北桥功耗也就是发热,原来5.8W的芯片组很可能抗不住,虽然从威盛时代就已经实现了集成南北桥。


不过现在的MCM胶水封装其实理论上已经不算胶水核心了,DIE间互连用的都是高速总线类似AMD用IF总线,相比数据交换经过北桥的老胶水现在的CCD IOD结构和全单DIE基本在使用中看不出来区别。兆芯下代KX7000可能会使用这种CCD IOD分立结构,也算是降低成本提升良率的一种不错的办法了。

兆芯到了KX5000其实已经可以认为是取消了北桥的,原先由南北桥芯片组实现的功能已经大量集成进核心了。留下的ZX-200与其说是南桥其实更像个PCIe功能扩展芯片。

从这里也可以看到五道口并不是完整版的成品,C860核显并不支持HDMI2.0,支持4K60只能靠DP,然而打不辅助板没有DP,而且KX5000虽然把南北桥集显集成声卡内存控制器PCIE控制器SUPERIO SPI都搬进了核心里但是还没有实现完全的SOC化,像是SATA控制器(正常由南桥集成)USB3.0控制器 专门连接有线网卡的吉比特介质独立接口Reduced Gigabit Media Independent Interface (RGMII)都仍然需要ZX200扩展芯片连接


ZX200,TDP=6W,40nm,基于PCIe3.0×4的扩展芯片
当然今天回头来看如果不用ZX200扩展芯片用其他的PCIe转接方案也是一样可以用,SATA不要了还可以直接走PCIe的NVME启动,网卡也可以直接连PCIe USB扩展卡也自然可以,威盛或者其他方案的也非常便宜,问题是到笔记本就不太好玩了,这些如果都没法通过单芯片解决就会显得比较复杂。

倒不是说笔记本加南桥就一定不行,就是显得非常的累赘增加成本和故障率之类的,能全集成肯定比不能强

无论怎么说,KX5000是兆芯成立以后完全自主设计的架构,用来证明兆芯拥有CPU IP的设计能力是没问题的。无论水平如何至少可以独立完成设计,这就够用了。


KX5000 DIE SHOT(核心照片)
整体来说KX5000的核心面积还是相当不小的,除了原生四核变成原生八核以外相当一部分面积是原来的南北桥的功能,比如内存控制器集显IO之类的,所以相比之前看起来很迷你的CPU就显得很大了。

原来的核心面积是真的小,毕竟CPU只负责运算,其余的数据交换全部通过南北桥芯片组实现,而现在几乎全部都要交给CPU了,这就是所谓的SOC化,system on chip片上系统。

但是由于是半成品结果SOC化并不完全,所以到了KX5000这代就显得CPU又不是特别强面积大良率也不见得高而且还得挂像是南桥实际上只能算是个PCIe扩展芯片的玩意,集成但是又没完全集成,CPU提升又没完全提升(最高主频依然2.0G,同频性能提升是有但是并不算特别大,只能说全系八核真正起到了作用,相比很难买到的服务器定位产品真正的普及了八核),八核只有I3 6100的性能水平但是好歹能用


最后是PPT的路线图,可以看到当时说后续未来发布的陆家嘴代号KX6000的原定时间在2018年,而实际上却是Q2'19,而直到22年Q4兆芯依然还在发布陆家嘴架构的KX6000G,提升集显性能和改进CPU物理设计的小改产品,KX7000至今仍未发布。
所以最后引用隔壁UP的视频原话作为结尾吧:
兆芯没有那么厉害只是一个工资低职员经常被挖成立刚到10年初始团队是2000年后原via在大陆的研发芯片组的分部毕业硕士博士组成的cpu专职研发人员曾经一度不到100人的国台合资中小公司,但确实有自主研发能力。能研发芯片组cpu微架构gpu图形芯片, 只能说尽可能尊重真正为国家发展高新产业的人,好人不多别让人寒心了。能给你日常使用的x86 cpu和显卡即使是鸡肋也比没有要强。
咱只想说引进吸收的磁悬浮列车再好再自主再先进那不是我们坐得起的,真正能带你日常安全高效的出行的永远是轮轨高铁动车组。隔壁性能再强不支持X86上不了高铁线路啊,有车没地方跑有什么用,而且实际性能怎么样还不好说,安全稳定之类的不提成本就受不了。哪怕兆芯目前的水平没有CR400AF CR400BF的水平但是至少也有CR300AF的水平了,速度不是很快那也比CR200J 25T的速度强啊,同样卖D字头的票价有这个体验还想怎么办,总比隔壁都上不了路还敢卖那么贵有用啊。就算其他高铁动车组全下马了或者买不到技术拉地铁电车上来用也不会全国开磁悬浮线路的。在这行生态就是一切,苹果iMac过去用摩托罗拉IBM的powerPC不行,现在用ARM一样半死不活。
能力有限,研发投入不高,体量不大,这些都是现实。但是这些不是一个或者两个小体量初创公司的问题,而是战略投入的问题,没有足够高的研发投入做什么都是困难很大的了,只有从基础教育抓起提高人才数量未来可能还是会有希望的。所以一些人与其作为某一种国产芯片的粉丝去攻击质疑其他国产芯片不如做好自己,哪怕多做些科普工作提高大众的知识水平都比说某某挤牙膏某某没有自主技术然后吹自家芯片多好有用,就像任正非说的,多为国家生产一个土豆都是做出贡献,多说一句话浪费别人的耳朵是吧。