欢迎光临散文网 会员登陆 & 注册

遇到GPU、NPU、DPU在不迷茫?各类芯片扫盲!!!

2023-02-21 22:55 作者:财智一点通  | 我要投稿

    大家好 ,我是一点通。想必大家阅读芯片类文章的时候,CPU、GPU、NPU、Soc等常用名词不绝于耳。不过当别人问你是啥的时候,估计很多人都会支支吾吾说不出啥来。今天我就带大家来扫盲一下。

cpu gpu npu


cpu是中央处理器。其事就是机器的“大脑”,也是布局谋略、发号施令、控制行动的“总司令官”。

CPU的结构主要包括运算器(ALU, Arithmetic and Logic Unit)、控制单元(CU, Control Unit)、寄存器(Register)、高速缓存器(Cache)和它们之间通讯的数据、控制及状态的总线。

简单来说就是:计算单元、控制单元和存储单元。(架构如下图)

cpu架构

如果你看不懂,我可以把他翻译成中文。简单来说就是,计算单元主要执行算术运算,存储单元主要保存数据以及指令等;控制单元则对指令译码。

    

CPU架构


2、GPU

GPU叫做图形处理器,又称显示核心、视觉处理器、显示芯片。

图形处理你是不是想到了显卡?提到显卡和GPU,人们会想到游戏和电影中精美的三维图形。其实,早期显卡不但不能处理三维图形,甚至连二维图形都无法处理,它仅具备显示能力。今天,GPU不但能够处理复杂的三维图形,还能作为协处理器,在通用计算中使用。

电脑图形处理器的发展是从图形显示适配器开始的,到图形加速器,再到图形处理器即GPU,其功能在不断增强。

3、MCU

mcu是微控制器,控制着汽车内所有的电子系统,比如多媒体、音响、导航、悬挂等。作为汽车电子控制系统的核心,mcu必须有着耐高温和坚固的特性,使之在复杂的汽车内部环境中不容易损坏。

MCU分为1位、4位、8位、16位、32位甚至64位单片机。4位MCU大部分应用在计算器、车用仪表、车用防盗装置。


4、NPU

近几年NPU特别火,我们可以理解为NPU就是AI芯片,普通芯片就是CPU。在自动驾驶和智能座舱都离不开NPU。换句话说,npu是具备智能和学习的特性, 也就是说这个处理器它是会模仿人的大脑神经网络的。在工作模式上,CPU主要是负责低精度,各种普通的数据,npu则是人工智能算法上面运行效率要高于另外两者。


npu架构

上层的应用程序可以通过加载模型与数据到 NPU 进行计算,也可以使用 NPU 提供的软件 API 操作 NPU 执行计算。

NPU包括三个部分:可编程引擎(Programmable Engines,PPU)、神经网络引擎(Neural Network Engine,NN)和各级缓存

可编程引擎可以使用 EVIS 硬件加速指令Shader 语言进行编程,也可以实现激活函数等操作。

神经网络引擎包含 NN 核心与 Tensor Process Fabric(TPF,图中简写为 Fabric) 两个部分。NN核心一般计算卷积操作, Tensor Process Fabric 则是作为 NN 核心中的高速数据交换的通路。算子是由可编程引擎与神经网络引擎共同实现的。

NPU 支持 UINT8,INT8,INT16 三种数据格式。



5、SoC

SoC芯片是芯片的一种,简单的理解就是把几种不同类型的芯片集成到一块芯片上,比如把CPU 、GPU 、存储器 、蓝牙芯片等集成到一个芯片上。

再例如,智能座舱上的wifi功能和蓝牙功能,都是集成在SoC芯片之上,例如8155就属于SoC芯片。


6、TOPS

TOPS也是我们常说的算力,1 TOPS代表处理器每秒钟可进行一万亿次。我们熟知的8155芯片算力是8TOPS,英伟达 orin芯片算力为254TOPS。

汽车从L1、L2、L3、L4、L5不断推进,某种意义上看,就是算力的竞赛,每往上进阶一级就意味着对算力的需求更高。

毫无疑问,当前的自动驾驶芯片市场发生了明显的变化,“大算力”正是一大趋势。除了英伟达,算力突破100TOPS的芯片陆续问世,比如已发布单颗芯片最高算力可达128TOPS的地平线征程5;单颗芯片最高算力可达176TOPS的Mobileye EyeQ Ultra等。


7、DMIPS

常常有人会把TOPS和DMIPS搞混,认为这两个词语都在表达同一种计算能力。其实并非如此,DMIPS是每秒处理机器语言指令数,而TOPS是每秒钟可以进行的操作数量。

例如8155芯片CPU能够达到105K DMIPS执行能力,算力是8TOPS,这显然是芯片两块不同领域的处理能力。

DMIPS是,用Dhrystone这套测试程序跑下来,每秒钟可以执行多少指令。

某种意义上,谁家的这个数字高,谁家的CPU就更牛。50000DMIPS就意味着每秒可以执行50000*100万条指令。


8、DPU

DPU和NPU的组合很像TOPS和DMIPS,很容易搞混。

DPU和NPU都是具有学习能力的芯片,只是DPU是深度学习处理器,是基于Xilinx可重构特性的FPGA芯片。而NPU不基于Xilinx。

不同于CPU的AI芯片,DPU可以用于机器学习、安全、电信和存储等应用,并提升性能

DPU是以数据为中心 IO密集的专用处理器。DPU对现有的SmartNIC 做了整合,能看到很多以往 SmartNIC 的影子,但明显高于之前任何一个 SmartNIC 的定位。DPU可以实现多种功能。以 Nvidia BlueField 架构为例,其功能模块如下图。

dpu


最近很火的赛道 电动车也涉及了大量芯片 这里小编也顺便介绍一下:

汽车芯片的种类

汽车芯片的三大类:

1、整车域的MCU。

2、自动驾驶域的AI芯片

3、智能座舱域的CPU。这三大门类都需要芯片,但是难度系数却相差很多。

汽车芯片从MCU到自动驾驶座舱,虽然有如果说MCU芯片的弱鸡性能让汽车的面子有点挂不住,那自动驾驶域的AI芯片可以说是扳回一城了。

1、自动驾驶域的AI芯片

以英伟达orin为例,orin的CPU内核是12个Coretex-A78(代号Hercules),GPU是Ampere。

我们拿蔚来ET7举例。

CUBA单元:蔚来ET7搭载了四颗NVIDIA ORIN芯片(近1000TOPS),其CUBA(Compute Unified Device Architecture)单元达8096,接近8704CUBA核心的RTX3080显卡。

晶体管数量:蔚来ET7搭载四颗NVIDIA ORIN芯片的晶体管数量为680亿,同期“秒天秒地秒一切”的苹果A14芯片的晶体管数量为118亿。

数据处理量:特斯拉FSD芯片内置图片处理器ISP,最高以25亿像素/秒的速度处理图像,大概是往21块1080P的高清屏幕上塞60帧画面。

NPU:特斯拉FSD芯片的神经处理单元NPU高速缓存32MB,与零售价16999元的英特尔酷睿i9-9980XE的33.75MB SRAM缓存总量相当


2、智能座舱芯片

智能座舱的主芯片一般称之为SoC – System on Chip即片上系统,它包括CPU、GPU,AI引擎,还包括处理各种各样摄像头的ISP,支持多显示屏的DPU、集成音频处理等等。另外第3代的数字座舱系统,配备了个性化的计算机视觉和机器学习的计算机应用平台,包含AI加速器等等。同时,高通在SoC上也集成了先进的Wi-Fi、蓝牙技术,可以支持眼下最热的Wi-Fi6以及蓝牙5.1的技术。

提到智能座舱芯片,不得不看高通骁龙8155芯片。

高通的8155芯片是一枚强大的智能座舱SOC芯片,全称是SA8155P,它采用7纳米工艺制造,具有八个核心CPU,算力为8TOPS,也就是每秒运算8万亿次,它可以最多支持6个摄像头,连接4块2K屏幕或者3块4K屏幕,支持WiFi6,支持5G,支持蓝牙5.0。

值得注意的是,8155芯片并没有独立的NPU内核,AI计算主要通过DSP、CPU和GPU组成的AI引擎完成。其中,Hexagon 690拥有7TOPS的AI算力,加上CPU、GPU的AI算力之和为8TOPS。而在制程方面,高通8155采用台积电N7工艺,也就是第一代7nm工艺打造,与骁龙855以及855+属于同一代产品。


3、整车域MCU

在智能化未普及之前,早期汽车是纯机械产品。那时的发动机并没有电子控制器、车窗也只有机械式控制,所以不需要任何芯片,更没有算力、图像处理这一说法。

在近几十年中,机械式的汽车逐步智能化。一次新增一个功能,就需要配一个MCU(Micro Control Unit)。这种发展方式,造成了MCU越多,线束凌乱的现状。这也构成了传统车企缺芯的现象。

当然,也不要小看MCU,这个领域支撑起来的半导体公司都是赫赫有名。如果对比的是汽车MCU芯片 —— 那的确,无论是性能上、制程上,手机芯片都要先进不少!


遇到GPU、NPU、DPU在不迷茫?各类芯片扫盲!!!的评论 (共 条)

分享到微博请遵守国家法律