Agent寒武纪大爆发,下半场是大模型应用层的“生存竞赛”
寒武纪生命大爆发是地球生命进化史上的一个重要事件。在5.4亿至3.6亿年前,海洋生物数量迅速增加,许多新的复杂生物形态如三叶虫、原始甲壳动物、海绵和脊索动物等更高层次的智能诞生了。类似于寒武纪生命大爆发,BabyGPT、AutoGPT、Generative Agents等实验性产品相继出现。

从进化的角度来看,生命体的发展主要通过单元增强和组织增强两种方式实现。这两种增强方式相辅相成,使生命体具备了更多样复杂的表达形式。如同Agent——我们希望它是在任何系统中能够独立思考并与环境交互的智能体。现在它已经有了一颗足够智商的“大脑”,如何让Agent像人一样思考和执行——只要给定任何一个目标,它就能自动解决各种问题。
在大模型的下半场,将是Agent寒武纪落地爆发的时刻。
OpenAI联合创始人Andrej Karpathy也高呼:“AI Agent代表着一个疯狂的未来。”而究竟什么是Agent?Agent可以理解为某种能自主理解、规划决策、执行复杂任务的智能体。Agent并非ChatGPT升级版,它不仅告诉你“如何做”,更会帮你去做。
虽然ChatGPT开启了“你问我答”的全新产品交互形态,也带来了大模型的科技浪潮。但惊喜之外,如何使用GPT成为大模型的普及瓶颈。非产品级应用AutoGPT的横空出世,一方面带来了解决方案,另一方面揭示了将大模型与电脑操作结合起来,解决脑力劳动端到端的智能化和自动化是人工智能最值得探索的方向。
2023年8月16日,实在智能作为国内AI准独角兽企业在第七次发布会上重磅推出了自研垂直大语言模型“塔斯(TARS)”,同时引爆业界的是全国首个基于大模型的TARS-RPA-Agent产品,实现“所说即所得,你说PC做”。
这是一个全新的尝试和探索,实在智能基于TARS大语言模型(通用基础模型、各个垂直行业模型)+ISSUT(智能屏幕语义理解)机器视觉大模型双模引擎,重构了技术底座,不仅首创了TARS-RPA-Agent,更对自身AI产品矩阵进行了全新改造,惊喜推出了TARS+、Chat+系列全新产品:Chat-IDP(智能文本审阅)、ChatBot(智能对话机器人)、ChatPlatform(智能门户平台)、TARS+国产信创IPA数字员工等。
而Agent究竟能为人类带来哪些方便呢?以请假这个常见场景为例,对于人类而言非常易懂、易处理,但如果要让大模型准确理解并自动操作完成任务,存在比较高的技术门槛。大模型需要理解,再需要执行,这其中无论是理解意图还是精准识别操作页面,都存在技术难点。
在这种情况下,TARS-RPA-Agent的双模引擎就发挥了作用。基于计算机视觉(CV)大模型的“智能屏幕语义理解”技术,使得TARS-RPA-Agent可以以人类视角,感知环境,实现“秒懂”屏幕画面,第一时间完成自动解析。
而这种通过文本指令或对话聊天的方式直接生成数字员工,操作各种电脑软件自主完成工作任务,正是TARS-RPA-Agent的核心工作流程,即自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验。
类似于寒武纪生命大爆发,未来是Agent的世界,越来越多的应用将在应用层上出现。这些应用不断迭代和更新,逐渐展现出更加复杂的智能形态。这意味着我们正在经历人工智能的高速发展期,大模型将极大地推动各个领域的发展和变革。