AI大模型十大亮点:垂直大模型成为大赢家!
人工智能的爆炸正在扭曲我们的时间感,打个形象的比喻,只要眨一下眼,你就会错过一个全新的行业。2022年的AI领域,大规模的生成模型像雨后春笋一样地冒出,改变了整个AI界的格局。

1.文字-图像生成映入眼帘
DALLE-2是第一个可以从任意标题生成逼真的高分辨率图像的大规模扩散模型。它启动了AI的艺术革命,催生了许多新的应用程序、初创公司和思维方式。在OpenAI之后,LMU的StabilityAI和runwayml迈出了英勇的一步,基于「潜在扩散」算法训练了他们自己的互联网规模的text2image模型。他们称该模型为「稳定扩散」,并开源了代码和权值(weighs)。最近,Stable Diffusion已经达到了v2.1版本,可以在单个GPU上运行了。
2.文字生成大爆发
大家都知道,我说的是ChatGPT!这是历史上唯一一个在5天内就获得了100万用户的应用程序。ChatGPT也大大启发了我们人类的创造力。ChatGPT和GPT-3.5都使用了一种叫做RLHF(「从人类反馈中强化学习」)的新技术。ChatGPT的流行,已经催生了一波新的创业公司和竞争者,国内外纷纷掀起大模型的浪潮。
3.机器人模型的出现
一个 「机器人GPT 」——名为VIMA的transformer。它可以接收任何混合的文本、图像和视频作为prompt,并输出机器人手臂的控制。模型被称为VIMA(「VisuoMotor Attention」),已经完全开源了。现在,单个智能体已经能够解决视觉目标、视频的一次性模仿、新概念基础、视觉约束等,具有了模型容量和数据的强大扩展性。
4.中国大模型不再坐而论道
随着百度、腾讯、新华三、华为等踏足大模型,于斗艳争先的过程中,巨头们无一例外都强调大模型降本增效、缩短链路、精准识别、智能替代等实干作风。不难看出,经过前期混沌蒙昧的扎堆,大模型开始变得成熟、务实和遵循商业逻辑,不再局限于一块屏幕做讲堂,或禁锢在一方实验室里“跑分”、刷榜,而是下基层、入车间、进工地,到更需要的地方去播种。
5.国产垂直大模型,为产业“织锦”
老百姓习惯用锦上添花比喻美上加美,好上加好,凡事也喜欢追求锦上添花的效果。但这里其实有一个前提,你得首先是一匹精良的锦缎,才能有接下来的添花步骤。具体而言,大模型可以在产业里充当“造铲人”、“摆渡人”和“破壁人”的一重或多重角色,物尽其用。
京东云依托大模型的智能城市操作系统,打造的“一网统管”新应用,聚焦社区治理、社会民生、消费分析等场景,通过一屏发现、一口派单、一站处置、一网评效、一键智搜的有机衔接,将问题的判断由经验推导转变为数据分析。
再如实在智能近期上线内测的实在TARS垂直大模型也将与实在RPA实现完美融合,乘着RPA产品落地各行各业的东风,找到了自己价值的“落脚点”:前者提供自然语言理解及逻辑知识的归纳泛化能力,后者基于实在智能自研的“智能屏幕语义理解技术(ISSUT)”,实现对一切屏幕上一切元素的自动化操作。通过二者的融合,提高数据处理和决策效率、增强风险预测和控制能力,赋能企业减少重复、繁琐的人工操作,成为越来越多的政府机构和企事业单位数字化转型的关键手段。
以上便是AI大模型领域的亮点盘点。每一步都是AI大厦里的一砖一瓦,所有的努力都应该庆祝。
毫无疑问,AI正引领我们迈向一个全新的时代。在这里,万物与大模型交汇,一切都不同以往。2023年是充满奇迹的一年,也是令人惊叹的一年。未来又会有什么震惊世界的突破?我们与你一起关注。