解读华为970与SoC的参数


趁着华为的麒麟970发布,我们来聊聊怎么看懂手机soc的各种参数。让我们再一次举国沸腾吧。
Soc是系统级芯片的意思,拥有很高的集成度。对手机来说,依然是一个发展中的概念。未来的soc可能会有不同的构造。现在来说,麒麟970在一片指甲盖大小的空间里,集成了55亿晶体管。骁龙835是31亿,苹果a10是33亿个,不含外挂的其他部件。如果是正常大小的晶体管,55亿个够堆满一个楼了。
麦克卢汉说过,媒介即人的延伸,soc也一样。
当前soc主要分为cpu,gpu,射频基带,wifi调制解调器,dsp,isp,应用处理器等等
篇幅有限,肯定是挑最影响体验的来说。麒麟970还多了一个独立npu,成为首个搭载ai芯片的手机处理器。大家可以根据目录跳转到感兴趣的部分观看。精彩的部分在ai。
Cpu就是中央处理器,相当于人的大脑。是一个超大规模的集成电路。可以进行运算和控制。包括定点浮点运算,逻辑操作等等。作用机制和原理我们不展开,知道是性能最相关的部件就行了。性能一般先看架构,架构越新越强,性能就越强。比如我们常见的有arm公司的公版架构a几几,还有高通苹果三星的自研或公版改进架构。同架构里面,我们才能比较核心数和主频。麒麟970用的还是arm的a73 4个,主频2.4ghz,还有4个a53,主频1.8ghz。总计8核。对比骁龙835,属于公版的小改版,主频都要高一些。2.45GHz1.9GHz。对比960采用的同样的架构和核心,主频2.36ghz,1.84ghz,970提高了大核主频而降低了小核主频。所以性能来说,970应该稍高于960和接近于835.当然这是峰值,实际体验中达不到的,发热压不住。不同架构的cpu跑分高低,不一定决定实际性能的高低。只能大致参考。
我们大概都听过一些笑话。比如俺们的是联发科8核,最强的。他们高通821才4核,根本不能比。高通660是最新的,看后两个数字,比835强多了之类之类的笑话。那么怎么看这些参数呢?
总结一句话。Soc的性能先看架构数字大,同架构看大核主频,主频接近看核心数,发热功耗看制成工艺几纳米。
当然严谨来说还有其他因素,也有例外,这里是方便快速判断的。
比如660架构kryo260,835是280.280数字大,不用看了。线下是利用了一般消费者只懂数字大小,容易被诱导。那么你现在明白不同架构的强弱,就领先了几亿ov用户,会看性能参数了。
看到这里,有些朋友就会问了。秋叶秋叶,你说的这些我也知道,但是4个a73 2.36g的麒麟960跟2个 a73 2.8ghz的联发科x30怎么判断呢?他核心数跟主频都不一样。
现在常见的核心都是4核,所以比主频。假如核心数跟主频都不一样,没有简单的方法去判断主频的差距跟核心的差距哪个大,最好是直接看跑分。Cpu看geekbench,gpu看gfx bench。但是也要知道,跑分跟体验不一定成正比。浮点整数运算的权重,手机的温控能力,系统的优化都会影响最终体验。这里只是看单一指标,不看总分。
比如一个手机cpu5万分gpu5万分,总分10万。另外一个手机cpu1万,gpu10万,总分11万,性能就更好吗?不一定。就好像我们手机本来很流畅,一发热降频锁核就卡了。如果cpu已经足够强了,那么gpu肯定越高越好。不同的架构很难对比,哪怕同频跑分其实也仅供参考。
那么gpu有什么用呢。
Gpu是视觉处理器,相当于画师。如果cpu既要处理运算,又要把运算变成图像让人看见,处理工作就太复杂了。于是就可以让gpu分担,尤其3d渲染最考验gpu能力。其实cpu也可以做图形运算。由于手机没有显存,所以要用内存中的一部分。分辨率越大手机,就越吃显存,其实就是吃内存。2k往往比1080p的手机多吃1g内存。
Gpu和架构大体有arm公版的mali,高通的adreno,苹果联发科都在用的 power vp。Gpu没大小核省电之说,主要是看核心数和主频。由于主频差不多,太高了太热,所以核心数最重要。也就是堆核策略。可以简单理解成画一幅画非常复杂,多一些人分别勾线,染色会快一些。超级牛的画师一般雇不起。
苹果的gpu是可以超频的。只要出现要卡的迹象就瞬间超频,保证人视觉的流畅。不管耗电发热都要保证流畅。所以游戏主播一般都用苹果。苹果就是视觉驱动的。而安卓就按部就班,该咋滴咋地,跟程序员一样,就不懂变通。未来希望不同平台都取长补短,趋于完善,更好的服务消费者。
麒麟970用的是arm的mali g72,采用三星一样的堆核策略。不过三星8895用的是20核g71,而970用的是12核 g72.按arm的说法,g72性能是g71的1.4倍,按性能叠加来说970略逊8895.当然最终效果还是要看手机的最终表现。差别不大也不好说。
说到这里,就可以回答很多网友的一个问题。麒麟用的是arm的cpu和gpu,凭什么说是自主研发设计呢?其实cpu和gpu对soc来说只是芯片,还要加入各种其他东西,集成整个soc。怎么封装,怎么协同工作,怎么散热等等都是华为做的。这可不是组装起来就能用,这么小一块集成度能那么高,你怎么组装。相当于给你泥土让你盖个楼去。需要非常庞大的工作和技术。就算给你笔记本的cpu和gpu,你也组不出一个笔记本啊。说970是华为自主研发设计的国产最强soc没有问题。说研发设计又没说是完全创造。
接下来我们说说基带芯片和射频前端。相当于顺风耳和大喇叭。作为远距离的数据传输工作。麒麟970采用4.5g lte技术,cat 18的基带。下行带宽1.2gbps。也就是千兆lte。首先这个4.5g是通信,跟5gwifi是两码事。肯定是优于目前的4g的。高通三星的下一代处理器也会搭载。华为刚好领先了几个月。
另外目前的通信企业还没有支持这么高的传输速度,所以暂时用不出来什么区别。我在香港用1000m wifi的时候,大陆还是20m。现在千兆传输都没商用,等到大陆普及恐怕还很久。其实我更在意wifi调制解调器的性能。抢网速能力牛的话,能把整个饭店的带宽霸占过来。
另外要说的是,基带和运营商支持千兆也不代表手机就一定可以达到理论带宽,还需要天线设计的支持。比如目前835也就是三星htc 可以跑满带宽,其他的都跑不满。那么带宽再高其实也没什么区别。Mate10应该会继续使用p10p的4x4mimo。4根天线的效率可以翻倍。而4x2mimo是两根天线。前一个数字是基站,后一个是手机。具体的效率影响就不展开了,通信博士能讲好几天。知道这个逻辑就行了。小米6还是2x2mimo呢。华为在通信上不仅是国产骄傲,在世界上也非常厉害。搞臭的都是公关和宣传部门。
最后我们来说说ai。关注我微博的小伙伴都看过我转载的ai围棋自我学习打败职业选手和ai的dota2 sf solo完胜职业冠军dendi。理想状态下的ai其实就是把人类理想化的设计变成现实。举几个简单的例子。游戏视频里面不是有很多弹幕大神号称嘴强王者么。如果把这里理想情况输入ai里面,就可以让嘴强王者变成现实。我们在设计程序的时候,执行效率就会比yes or no的逻辑更加高效。Ai可以判断识别指令,并按照预设逻辑去学习并输出内容。理想状态可以参考钢铁侠里面的贾维斯系统。
华为这次抢到了首发手机ai芯片的噱头,是有非常重大的战略意义的。因为苹果高通都在做。高通835就已经支持ai的一些架构了,只是还由cpu gpu运算。苹果也做了ai芯片,只是对端侧和端云瞻前顾后,还没推出而已。
什么意思呢。我们都用过语音助手吧,为什么语音助手一定要联网呢,大家有没有想过。其实这就是ai处理的,手机无法负担那么庞大的运算量,所以是传到云端,然后由服务器分析你的意思并执行指令。而华为的独立ai芯片可以做到不联网就自己运算。当然为了更高效,最终肯定是手机端完成一部分,复杂的还是由云端服务器运算。苹果就犹豫了,把用户的数据上传到云端分析整理,万一被黑了咋办。大家还记得苹果的艳照门和支持斯诺登的事情吧。苹果对用户隐私的处理是非常谨慎的。
华为研发ai应该是5年前。其实我在荣耀7评测聊到ai应该干什么。比如测算手最不抖的区间来拍照。拍出的照片套用最合适的修图方法来再处理,录像挑选最不抖的帧来合成并用动态模糊来补帧等等。相当于手机多了管家替你操作。多了ps高手替你修图等等。想想是不是还有点小激动。
那么现在的970做到什么程度呢?
手机soc有那么多的元器件,可以实现那么多功能,但是却没有过npu。也就是神经网络处理芯片,采用自主hiai架构。Hiai架构集合了cpu,gpu,isp/dsp和npu,可以完成ai运算。专用的npu可以大大增加ai效率。
什么意思呢。手机的所有软件和功能都可以调用soc对应的硬件,cpu gpu这些。但是如果我设置一个ai场景,比如照片修图应该套哪一个白平衡算法,加入npu可以提升能效比50倍。这就相当于用windows自带的绘图软件修图和用ps修图。最终效果一样,但是专业的更高效更简单。Npu就相当于预设了各种特殊的技能,可以专款专用。
这个NPU的计算速度是:1.92T FP16 OPS。这个速度与顶级移动GPU相比,尽管更快但仍在同样的数量级水平,不过在功耗方面具备优势。
华为说图像识别速度可达到约2000张/分钟。三星S8使用CPU处理每分钟仅95张,苹果iPhone 7 Plus同时使用CPU和GPU,每分钟也仅能识别487张。这肯定是理想状态下。按华为的说法提高50倍,如果没有npu,除以50就是40张,比s8差远了岂不是说原本的性能很差么括弧笑。
关键就看npu可以学会什么技能,以及这些技能实际场景中能提升多少。那么华为为什么能比苹果领先呢。很重要的其实是这个npu的后台,中科院计算所的孵化项目寒武纪。前不久刚完成A轮融资,成为全球AI芯片界第一家挤入独角兽阵营的创业公司。寒武纪大家可以简单看一下我找的新闻稿,应该看得懂。
2014年,陈氏兄弟提出了首个深度学习处理器架构“寒武纪”以及配套的指令集“DianNaoYu”(电脑语),这也成为全球首个深度学习指令集。
据报道,“DianNaoYu”指令直接面对大规模神经元和突触的处理。一条指令即可完成一组神经元的处理,并对神经元和突触数据在芯片上的传输提供一系列专门支持。
总而言之一句话,使用这套芯片架构+指令集,能加速深度学习。
在广为流传的报道中,寒武纪2016年拿下1亿元订单。所以现在也有说法是,华为花了1亿元买寒武纪的指令集云云。指令集是计算机软硬件生态体系的核心。Intel和ARM正是通过其指令集控制了PC和嵌入式生态体系。
目前ai还跟3d touch一样除了系统没什么其他软件支持。但这绝对是开启未来科技的一把钥匙。哪怕苹果把他推到可用的高度,华为也可以借到东风。还能嘲讽。当然也有可能是华为推上去苹果借东风被华为加倍嘲讽。可以期待的就是mate10的语音助手和拍照算法。
最后再说一下制程工艺是台积电10nm。功耗和发热都会有可观的改善。为什么还是10nm呢。因为摩尔定律失效,晶体管达到5nm的时候,就脆弱的无法使用了。所以商用7nm基本就到头了。后面的就是继续改进架构,加强散热等等的工作。
其他部件比如Dsp是数据处理专家,可以作为好多环节。isp是图像信号处理。对于拍照成像有很大影响关系。升级比较常规,自研双isp,到时候可以跟三星的自研isp对比一下。音质部分采样率略有增加,我们都等实际表现再看。说不定还会用独立hifi芯片呢,集成的意义就不大。
好了,那么这一期的内容就到此为止了。