欢迎光临散文网 会员登陆 & 注册

通用机器人里程碑:实在智能推出国内首个基于AI大模型的Agent智能体

2023-08-24 11:23 作者:实在RPA_IPA  | 我要投稿

AI Agent被认为是OpenAI发力的下一个方向。OpenAI联合创始人Andrej Karpathy在近期的公开活动上说 “ 相比模型训练方法,OpenAI内部目前更关注Agent领域的变化,每当有新的AI Agents论文出来的时候,内部都会很兴奋并且认真地讨论 ” 。


早在3月份,AutoGPT就在GitHub上获得7.4万星,并快速成为史上Star数量增长最快的开源项目;而后发布的BabyAGI、AgentGPT更如雨后春笋般涌现:订购披萨、整理邮箱、创建博客,甚至举办一场情人节派对……

虽然越来越多的AI Agents出现在人们生活的各个场景下,但其始终不是产品级应用,这股热潮蔓延的前提,是要出现产品级的应用,自主执行、独立运作。


数字助理时代来临


与其把AI Agents当作ChatGPT升级版,不如将它视作人类的“数字助理”更为合适。它不仅告诉你“如何做”,更会“帮你做”。只要给定目标,它便可以模拟智能行为,自主创建任务、重新确定任务列表优先级、完成首要任务,并循环直到目标达成。简单来说,只需要给它一个目标,AI Agents就能完成剩下的全部工作。这种现象放在科幻电影里并不难,但在人工智能探索历程上,已经持续了将近半个世纪。


近日,实在智能正式发布“塔斯(TARS)”大模型,并震撼推出行业首个基于大模型的TARS-RPA-Agent产品,将数字员工应用门槛进一步大幅降低,实现“所说即所得,你说,PC做!”TARS-RPA-Agent”是业界首款将计算机视觉与大语言模型结合的智能体产品,相信会对RPA行业的发展具有里程碑的意义。


就像人类一样,TARS-RPA-Agent在从事复杂任务时,每一步之间往往会有一个推理过程。基于“TARS+ISSUT”双模引擎,TARS-RPA-Agent有“大脑”,更有“眼睛和手脚”,将推理能力和行为决策紧密结合了起来,使语言模型可以根据知识进行有逻辑的计划安排,自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验。


例如,如果你问TARS-RPA-Agent“我要买一台笔记本电脑,帮我推荐下”,TARS-RPA-Agent基于计算机视觉大模型的“智能屏幕语义理解”技术(ISSUT)“秒懂”屏幕画面,第一时间完成自动解析,并且将其拆解成“登录购物网站,查询笔记本电脑品牌、配置、价格等信息,完成产品推荐”等多个步骤并加以自动实现。在这个过程中,TARS-RPA-Agent也存在避免理解偏差或者操作失误的反馈机制,以及结合上下文扩展和向量检索等技术下的长时记忆能力,以便后续分析和优化。


人类最显著的特征之一就是使用和创造工具。通过配备外部工具,来调用各种接口,Agent产品能够模拟人类使用工具,完成更复杂的任务。虽然技术层面并未完全成熟,但基于大模型的Agent产品自主执行、迭代优化、“解放双手”的能力也让走红成为必然。


通用机器人里程碑:实在智能推出国内首个基于AI大模型的Agent智能体的评论 (共 条)

分享到微博请遵守国家法律