欢迎光临散文网 会员登陆 & 注册

电子行业深度报告:边缘域AI的“寒武大爆发”

2023-08-08 09:24 作者:报告派  | 我要投稿

报告出品方:民生证券

以下为报告原文节选

------

序:边缘域 AI 的“寒武大爆发”

“寒武纪”是距今约 5.3 亿年的地质时代,深远的海洋中诞生了一大批生物,地球物种空前繁荣昌盛,这也是显生宙的开始。
为何会有生命大爆发?古生物学众说纷纭,有地球变暖说、氧气水平升高说等等。但无论哪种观点都认为,在寒武纪,地球的生态变化跨过了奇点,进而改变了一切。
自 ChatGPT 问世以来,从 GPT-1 到 GPT-3.5,GPT 模型的智能化程度不断提升,GPT-4 多模态模型的发布进一步加速产业革命。ChatGPT 对智能终端的赋能,同样将开启新一轮“寒武纪大爆发”时代。




AIGC 内容快速发展下,未来智能终端 (平板、手机、音响、电视、IOT 等) 的人机交互都有望重构。当下,各大厂商争先发布大模型,如 ChatGPT、百度文心一言、三六零大模型、华为盘古大模型、阿里大模型等,国内外大模型加速应用落地,多模态大模型赋能下通用与垂直应用场景的应用端革新渐渐开启。




AI 大模型的进展带来边缘域 AI 三大产业链环节的变革。边缘域 AI 产业链包括智能硬件、模组、芯片三大环节。AI 大模型的迭代推动了边缘域 AI 的应用发展,将对应用于 AI 领域的模组以及算力芯片提出更高的要求,同时带动应用端智能硬件的革新。




1 AI 发展复盘,轻量级模型重构边缘域

1.1 ChatGPT 引领大模型浪潮,AI“iPhone“时刻已至

ChatGPT 为 AI 的“iPhone“时刻。3 月 21 日,英伟达 CEO 黄仁勋在 GTC2023 大会上将 ChatGPT 比作 AI 的“iPhone“时刻,AI 时代加速来临。
自 ChatGPT 问世以来,从 GPT-1 到 GPT-3.5,GPT 模型的智能化程度不断提升,ChatGPT 在拥有 3000 亿单词的语料基础上预训练出拥有 1750 亿个参数的模型(GPT-2 仅有 15 亿参数),预训练数据量从 5GB 增加到 45TB,模型从预训练+微调转变为人工标注数据+强化学习,人工智能取得技术突破。而随后 GPT3.5 turbo 带来 10 倍成本的降低及 GPT-4 多模态模型的发布,进一步加速生产力的全新跃迁。




多模态模型成重要趋势,AI 应用空间有望进一步拓展。多模态模型结合来自不同模态(例如文本、图像、语音等)的数据进行联合建模,应用于自然语言处理、计算机视觉、语音识别等领域,有效提高模型的准确度和稳定性。




从 Open AI 产品矩阵可以看出其已经布局文本、图片、语音等多模态产品,未来将逐步探索多模态的融合,实现图像、视频、文本间跨模态生成,显著提升智能终端产品体验,带来各行各业生产力水平的质变。




国际科技巨头加紧布局多模态模型领域。微软和谷歌两大巨头相继推出大模型,2023 年 3 月,OpenAI 推出 GPT-4 模型,可以接受图像和文本输入,并输出文本。3 月谷歌推出 PaLM-E 模型,通过输入多模态语句,包括视觉、连续状态估计和文本输入编码,来执行机器人操作规划、视觉问题解答等具体操作;5 月谷歌推出 PaLM2 模型,支持 100 多种人类语言与 20 多种编程语言,同时支持读取与生成音视频内容。




AI 领域群体效应下,国内大厂纷纷入局。国内 AI 大厂以百度文心一言发布为拐点,未来有望凭借更优质的中文数据和多场景的应用实现弯道超车。百度文心一言是国内首个全栈大模型产品,模型发布后申请合作厂商超 9 万家,腾讯、阿里、华为、商汤等大厂在 AI 大模型领域已有成熟布局,相关应用有望快速发布。
伴随着多模态大模型的不断涌现,更多场景的 AI 应用将加速落地。





1.2 API Plugin 引入,海量应用迈入 AI 新时代

Plugin 开启 AI 的“APP Store“时代,生态版图进一步扩展。2023 年 3 月2 日,Open Al 推出了自然语言对话模型 GPT-3.5-Turbo 和语音转文本模型Whisper models 的开发者 API,使得多种应用程序可通过 API 的方式接入ChatGPT。3 月 24 日,ChatGPT plugins 的发布,进一步扩大了 ChatGPT 的应用能力并催化至多场景的业务处理能力,AI 的“APP Store“时代到来。




插件商城接入 10 余家应用,具备检索实时信息、检索知识库信息和代替用户操作应用功能。Open AI 官网显示,目前 Plugin 已接入 Expedia、FiscalNote、Instacart、Kayak、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram以及 Zapier 等应用,涉及旅行、购物、航班、推荐餐厅、语言导师等各个方面。
未来,随着各类应用与 ChatGPT 的结合,GPT 生态系统有望迎来“苹果+App Store”的繁荣时刻。




1.3 龙头厂商加注轻量级模型,边缘 AI 迎“安卓时刻”

除大模型外,龙头厂商也纷纷布局轻量级模型,当前 Meta、谷歌、高通等公司已开始发力边缘 AI。谷歌和 Meta 分别于今年 5 月 11 日和 7 月 19 日发布了各自最新的大语言模型版本 PaLM 2 和 Llama 2,较以往版本实现测试数据、性能等全面优化,轻量化版本均能应用于边缘端,其中最新发布的 Meta 大模型Llama 2 更是开放开源免费使用,有望推动边缘 AI 迎来“安卓时刻”。此前,芯片龙头厂商高通也首次成功实现 Stable Diffusion 模型在手机端应用生成 AI 图像,并于 5 月 30 日宣布高通正在转型为边缘计算公司,全面下注边缘 AI。




1.3.1 Meta 发布最新 AI 大语言模型 Llama 2

继今年 2 月发布 Llama 1 大模型后,Meta AI 在 7 月 19 日凌晨发布了最新一代的开源大模型 Llama 2。该模型在测试中表现优异,Meta 计划将该模型开放开源免费使用,且支持高通芯片运行,有望助力边缘 AI 加速落地。

Llama2 模型的训练数据量、参数均有增加。Llama 2 的参数、训练数据和上下文长度相比上一代模型增加。新模型 Llama 2 系列包含 70 亿、130 亿和 700亿三种参数类型,相比原来 Llama 1 最多 650 亿参数有所增加。并且,相比于Llama 1 预训练模型 1.4 万亿的训练 token 数,Llama 2 预训练模型的训练数据提升了 40%至 2 万亿,且针对聊天用例进行的 Chat 模型精调训练数据超过 100万人类标记数据,使用人类反馈进行强化学习(RLHF)从而提高模型安全性。此外,对于大模型非常重要的上下文长度限制,Llama 2 比 Llama 1 翻了一倍至 4096字符,能处理更多信息。Llama 2 模型在大多数基准测试中表现优于其他开源模型,包括编码、推理、知识、精通性测试等。不仅如此,Meta 从有用性和安全性进行评估,认为 Llama 2 有希望成为闭源模型的替代品。




Llama 2 开放开源免费使用,加速生态构建。Llama 一直以来是 AI 社区内性能最强的开源大模型之一,但此前存在开源协议问题,此次 Meta 发布 Llama 2模型将免费供给研究和商业用途,有望吸引更多开发者,加速 AI 应用落地节奏。
此外,Meta 宣布与微软云服务 Azure 合作开发基于 Llama 2 模型的云服务,微软作为全球领先的大模型和云服务厂商,二者合作有望加快生态构建速度。
Llama 2 可用于高通芯片,有望加速边缘 AI 落地。Meta 与高通宣布 Llama2 将于 2024 年应用于高通骁龙芯片,成为谷歌 PaLM 2 大模型之后又一个将运行于高通芯片的大模型。目前已有开发者将 Llama 2 模型部署至手机终端,实现离线运行,将来 Llama 2 模型有望进一步运用在汽车、PC、AR/VR 等终端设备上,无需担忧网络连接和云端拥挤问题,可提高服务的可靠性,并且减少云端运行成本;个人数据和信息仅保存在设备边缘端而非云端,可满足用户数据保密需求,并且不牺牲隐私即可提供更个性化的产品和服务,推动边缘 AI 加速落地,也将推动边缘硬件加速迭代。




1.3.2 谷歌发布通用大语言模型 PaLM 2

在 Meta 之前,谷歌率先于 5 月 11 日发布通用大语言模型 PaLM 2,并且包含轻量化版本,可运行于移动终端。PaLM 2 性能全面优于前代模型,部分领域能与 GPT-4 竞争。多语言能力方面,作为驱动 AI 机器人 Bard 的模型的升级版,PaLM 2 可使用 Fortran 等 20 多种编程语言,100 多种口头语言进行数学、软件开发、语言翻译推理和自然语言生成,多语言能力全面超过前代 PaLM 模型,同时部分语言能力基准测试结果超过 GPT-4。编程能力方面,PaLM 2 改进了编程能力,谷歌通过调整预训练数据集构建了 PaLM 2-S*模型。该模型擅长 Python、Javascript 等流行编程语言,也可以生成 Prolog、Fortran 等语言的专用代码。




PaLM 2 轻量化版本能够运行于移动端,将带动边缘 AI 计算成长。PaLM 2包括 Gecko、Otter、Bison 和 Unicorn 四种不同参数规模版本。其中,最轻量版本 Gecko 可在移动设备端运行,提供每秒处理 20 个 token 的能力。此前大模型在边端的应用主要通过 API 接口调用,模型本身的训练和推理仍在云端进行,对边缘侧终端以及芯片更新没有太大需求。轻量化模型可以降低边缘侧模型部署成本,使 AI 模型离线应用成为可能,从而提供定制化、低时延、高安全性与隐私性的下游应用,开拓 AI 模型在边缘侧推理的场景。这将带动边缘 AI 计算成长,加速边缘硬件市场更新迭代,提升智能硬件用户使用体验,使智能硬件成为新的 AI 流量入口。
PaLM 2 已被应用于多个谷歌应用,并支持特定领域应用。PaLM 2 已经被用于支持超过 20 种谷歌应用,包括办公软件系列、谷歌搜索以及 AI 机器人 Bard。
以 PaLM 2 驱动的 Bard 将具备更强的多模态理解能力,使其能够理解用户的图片提示并在回复中包含图片。PaLM 2 能提供医疗、网络安全等特定领域内的服务,基于健康数据训练的 Med-PaLM 2 能够在美国医学执照考试式的 MedQA 数据集上达到“专家”级别表现,基于网络安全数据训练的 Sec-PaLM 2 可以用于解释潜在恶意脚本行为,这两种模型将通过谷歌云向特定用户提供服务。




1.3.3 高通实现 Stable Diffusion 手机端运行,宣布转型边缘计算

除大模型厂商外,芯片厂商也正积极布局边缘 AI。高通在今年 5 月 30 日宣布正在从通信公司转型成为边缘计算公司。公司高级副总裁 Alex Katouzian 表示,数据中心在连接设备和数据流量大幅增长的情况下叠加的成本节节攀升,将内容均发送云端的传统做法不再经济,也无法满足未来 AI 所需的比云端计算更强大的算力,同时考虑到日益增长的用户隐私需求,由云端算力转向布局边缘算力正当其时。Alex Katouzian 强调高通截至今年 5 月底已向全球出货 20 亿件搭载 AI 功能的智能产品。
此前,在 2 月 24 日,高通宣布首次实现在手机端运行 Stable Diffusion 模型。Stable Diffusion 模型作为现下最先进的生成式 AI 模型通常只在云端运行。
而高通 AI Research 通过高通 AI 软件栈实现全栈 AI 优化后成功在安卓智能手机端运行 Stable Diffusion 模型,这一全栈 AI 优化方案能显著降低运算时延和能耗,可以在 15 秒内进行 20 步推理,生成分辨率为 512x512 的高清 AI 图像,且文本输入不受限制。在智能手机终端成功运行 Stable Diffusion 模型后,高通更长远的目标是可以适用 PC 等其他终端和其他模型。




2 从音频到视频,探讨硬件终端的重估值潜力

GPT 变革内容生成与交互方式,AI 智能终端百花齐放。自 GPT-4、百度文心一言、Microsoft 365 服务全面接入 AI 驱动工具 Copilot 以来,国内外各大厂商争相开启 AI 赋能,通用+垂直场景协同发展,B 端和 C 端天花板有望进一步打开,AI 应用在多种场景的扩散正全面演绎。
海外大厂积极布局物联网和人工智能领域,AI 应用发展迅速。1)微软在物联网+AI 领域的布局非常全面,覆盖了物联网平台、机器学习、边缘计算、解决方案加速器和开发工具包等方面,为企业提供了丰富的技术和解决方案,其中Microsoft 365 服务全面接入基于大型语言模型的 AI 产品 Copilot 打通了 AI 应用的第一站;2)谷歌通过收购 Nest 和开发新的技术,在智能家居、可穿戴设备和其他物联网设备的市场上拥有广泛的影响力;3)亚马逊的 AWS IoT 服务也为企业提供了构建物联网解决方案所需的基础设施和工具,包括设备管理、数据采集和处理、安全和认证等。





国内大厂在人工智能和物联网领域也有着广泛的布局,涵盖自动驾驶、智能家居、云服务等多个方向。百度成立智能驾驶事业部,并先后在智能家居市场推出智能音箱产品 DuerOS、小度智能屏等;腾讯成立“Tencent IoT”,专注于物联网领域的技术研发和应用,该部门主要提供包括智能硬件开发平台、物联网云服务等多种服务,帮助企业快速接入物联网;阿里巴巴推出物联网平台 Link IoT,以帮助企业构建物联网解决方案,提供从设备管理到数据分析等一系列功能,同时发布物联网操作系统 AliOS Things,可帮助设备厂商快速构建物联网设备。





2.1 AI 开发平台赋能行业应用

AI 开发平台流程包括数据处理、模型搭建、模型训练、模型评估及模型部署五个步骤。数据处理包括数据采集、数据筛选、数据标注、数据分组等环节,以此实现高质量的数据准备和输出,保证模型质量。模型搭建环节包括模型筛选和参数调配,在此基础上进行模型训练与优化。多轮训练迭代之后,开发者可以通过预设指标对模型的性能、质量进行评估,评估通过后可以进行模型部署,将模型转化为AI 应用。凭借较高的部署效率、丰富的计算资源、强大的存储能力、专业的运维团队等优势,很多企业已将 AI 开发平台作为 AI 开发方式的首要选择。




大模型的突破和云计算技术的成熟将推动中国 AI 开发平台市场规模保持高速增长。据头豹研究院测算,2022 年中国 AI 开发平台市场规模达 257.3 亿元,2017-2022 年 CAGR 高达 62.9%。虽然目前市场竞争加剧,但考虑到大模型的持续突破和下游应用的不断革新,预计 2022-2027 年中国 AI 开发平台市场规模 CAGR约为 24.9%,2027 年市场规模达到 785.2 亿元。





大模型的突破将拓宽 AI 开发平台的行业应用。据头豹研究院统计,目前 AI 开发平台的应用主要集中于金融、泛娱乐及教育领域,由于技术落地的局限和数据安全等问题,医疗等重要应用场景的渗透率有待进一步提高。随着大模型的突破和技术的不断成熟,AI 开发平台有望对重要应用场景进一步渗透,持续赋能行业应用。

2.2 音频入局,率先发力

音频入局,率先发力。音频作为轻交互的方式,更适用于碎片化场景,以ChatGPT、文心一言为代表的生成式 AI 模型提高了智能音频设备的交互体验,生成内容质量提升进一步满足用户在真实场景中服务客户的需求,未来会逐步实现个性化和情感交互,2023 年,各大厂商争相发力音频领域:

1)2 月 9 日,百度宣布将融合文心一言,打造针对智能设备场景的人工智能模型「小度灵机」,并将其应用到小度全系产品中;

2)4 月 11 日,天猫精灵宣布将正式接入阿里巴巴“通义千问”大模型;

3)4 月 11 日,Innovative Eyewear 官宣推出一款名为“Lucyd”的手机应用,该应用可以为智能眼镜用户提供 ChatGPT 的语音服务,用户既可以使用智能眼镜内置的麦克风进行语音交互,也可以使用 AirPods 等硬件设备语音唤醒;

4)5 月 11 日,谷歌推出 PaLM 2 Gecko 轻量级 AI 模型,可在手机及 IOT 设备本地或离线运行,加速 AI 赋能智能终端。




AIGC 落地的第一站——智能音箱(智能家居)&耳机(可穿戴设备)。为什么说智能音箱&耳机可能成为 AIGC 落地的第一站,我们主要从三个方面论证:

1、 技术层面:以 ChatGPT 为代表的生成式 AI 系统将不断优化提升智能语音交互反馈的丰富度和准确性,大大改善消费者体验,为智能音箱&耳机等可穿戴设备的进一步渗透打开成长空间。
2、 商业模式:智能音箱和耳机具备商业模式颠覆式创新的可能性,未来接入ChatGPT plugins API 后,智能音箱和耳机既可以直接调用 APP,完成生态系统的创建,实现To B收费;也可以对接更为丰富的内容/教育资源,实现 To C 收费。
3、 发展阶段:1)智能音箱:经过近 10 年发展,已具备一定用户基础和发展土壤。目前各大厂正向发力 AI+智能音箱领域,如百度融合文心一言打造“小度灵机“、天猫精灵接入通义千问大模型等。2)耳机:从 2021 年开始 TWS 耳机市场的增长态势放缓,AIGC 有望赋能开启新成长空间。

科大讯飞发布 iFLYBUDS Nano+,集成了生成式 AI 技术,可实现全场景录音转写、VIAIM AI 会议助理等功能。




前文我们强调了音箱+耳机的音频属性。展望边缘 AI 的未来,二者在各自领域扮演的角色是不一样的。
1)智能家居:1+N 模式为未来趋势。
“1”代表信息处理核心,用于接收用户指令及处理计算,目前智能家居方案商更多采用智能音箱作为控制核心,而机顶盒/投影仪等同样有潜力成为智能家居的算力中心。而目前边缘设备算力有限,后续如若有本地化大模型的需求,则需提升终端算力。“N”代表 N 个智能家居设备,由计算中心进行统一控制,核心搭配WiFi/蓝牙等连接芯片。智能家居设备种类多样,包括智能照明、智能窗帘、智能安防、智能影音娱乐、智能用水、智能网络等。通过在边缘侧进行大模型的推理,省略云端计算的步骤,可以使得信息指令输入输出时延更短等,能使人机交互更顺畅,提升用户体验。




2)可穿戴设备:耳机入口+边缘算力

相较音箱对于智能家居的重要地位,耳机在可穿戴设备中扮演的是入口的角色。耳机可以更便捷地接受用户指令,并向下连接负责处理信息的边缘设备——如 PC、手机、手表等,由其中的 SoC 进行推理。华为智能手表新品 WATCH Buds于 2022 年底正式发布,实现了手表+耳机二合一,即在智能手表内部隐藏 TWS无线耳机,通过弹盖可取出耳机,WATCH Buds 搭载 HarmonyOS 3 系统,通过耳机和手表的强互联,实现 AIGC 在可穿戴设备领域的应用。




2.3 视频决胜,全面感知

在经历文本、图像、语音等生成式 AI 系统陆续落地之后,我们认为视频将是后续 AIGC 落地的重要应用场景之一,主要应用在行业端的智慧城市、智慧交通以及消费端的家庭安防、智能门锁等。
在 AI 赋能下,摄像机从传统的视频监控终端演变为万物互联中最主要的智能物联终端,视频数据作为重要的数据底座,为行业或城市提供多维数据汇聚、处理、治理、挖掘、服务等支持。围绕智能识别、智能调度、智能研判等核心 AI 能力,利用认知模型、知识图谱等技术,可实现视频数据价值挖掘,进而赋能公共安全、交通管理、城市治理、生态环保、智慧办公、智能家居等应用领域:

1)智慧安防方面,智能监控摄像头是最常见的安防应用之一。计算机视觉技术可以用于自动检测异常行为、识别人脸和车牌等等,从而提高监控的准确性和效率。此外,计算机视觉还可以识别其他异常事件,例如火灾、烟雾、盗窃等,从而增强监控系统的安全性和可靠性。
2)工业机器视觉:视觉感知技术也可赋能工业物联网、智慧物流和智能制造领域,推动生产、物流的数字化和智能化。例如工业机器人在汽车行业、新能源行业的应用。
3)除此之外,在卫星遥感、智慧家居、智慧金融、智慧政府等方面,AI 同样可以赋能视频数据价值挖掘。


--- 报告摘录结束 更多内容请阅读报告原文 ---

报告合集专题一览 X 由【报告派】定期整理更新

(特别说明:本文来源于公开资料,摘录内容仅供参考,不构成任何投资建议,如需使用请参阅报告原文。)

精选报告来源:报告派

科技 / 电子 / 半导体 /

人工智能 | Ai产业 | Ai芯片 | 智能家居 | 智能音箱 | 智能语音 | 智能家电 | 智能照明 | 智能马桶 | 智能终端 | 智能门锁 | 智能手机 | 可穿戴设备 |半导体 | 芯片产业 | 第三代半导体 | 蓝牙 | 晶圆 | 功率半导体 | 5G | GA射频 | IGBT | SIC GA | SIC GAN | 分立器件 | 化合物 | 晶圆 | 封装封测 | 显示器 | LED | OLED | LED封装 | LED芯片 | LED照明 | 柔性折叠屏 | 电子元器件 | 光电子 | 消费电子 | 电子FPC | 电路板 | 集成电路 | 元宇宙 | 区块链 | NFT数字藏品 | 虚拟货币 | 比特币 | 数字货币 | 资产管理 | 保险行业 | 保险科技 | 财产保险 |

电子行业深度报告:边缘域AI的“寒武大爆发”的评论 (共 条)

分享到微博请遵守国家法律