更智能的「车载助理」或将成为影响消费者购车的关键因素
如今,用语音命令来为用户完成任务的应用程序,即语音助手已经非常普遍了,并且被应用于智能手机、平板电脑、计算机、扬声器以及越来越多的汽车中。
车载AI语音助手作为终端用户与车辆系统和服务之间的中介,允许驾驶员在不离开方向盘的情况下访问信息并执行任务。近日,一个神秘的数字助理大幅推动了车载数字助理的发展。
介绍这个神秘的数字助理之前,我们先来了解一下车载助手的现状。车载助手用例可分为两类:基本功能,如拨打电话、查询路线、发送文本或播放音乐;以及更多个性化的上下文服务。
虽然基本用例最为常见,但原始设备制造商正在努力支持复杂用例,尤其是随着更多自动驾驶解决方案上路。例如,车载数字助理可以根据一天中的时间、地点以及用户的食物偏好和预算限制提供餐厅推荐,然后为他们预订餐桌。
考虑到消费者兴趣,车载数字助理逐渐成为车辆差异化的关键因素。
如果执行得当,车载数字助理可以激发与司机和乘客的自然对话,改善用户体验并建立客户关系。有越来越多的原始设备制造商开始尝试利用第三方工具和服务设计可以更快地部署并更容易设计数字助理。

但在车载数字助理产出之前,它必须先是机器人数字助理,然后才是应用在任何屏幕(比如车载平板)。
于是,说回我们神秘的数字助理,它能让我们只用动嘴,就能快速拆解意图,识别对应屏幕,进行落地操作,不仅是在电脑上在任何屏幕(车载屏幕)上都能实现这个操作。这位能够「听得懂,想明白,看得见,动起来」的数字助理,便是实在智能发布的业内首款基于大模型的Agent产品TARS-RPA-Agent,也叫ChatRPA。
只用动嘴的TARS-RPA-Agent车载数字助理
举个例子,在汽车环境下,除了当下已通过接口方式实现对所有车载设备进行控制,如控制车窗空调、播放音乐、导航等简单操作之外,TARS-RPA-Agent还可以通过语音指令轻松指挥车载平板上所有的软件APP(如钉钉、微信、甚至是WPS、美图秀秀等),自动完成各种复杂工作任务。

这意味着,AI从一个被动工具摇身一变为“智能助手”,它不再是传统意义上的“机器人”,而是一个由计算机视觉与大语言模型结合的“塔斯小助手”。这种全新的人机协同模式背后,是强大的技术底座支撑:以TARS大模型和ISSUT智能屏幕语义理解为基座的技术框架,实在智能创新性地把CV大模型(ISSUT)、LLM(TARS大模型),以及RPA整合在了一起,并通过不同的技术、设计和方法实现了“你说,PC做”新境界。
随着越来越多的电动汽车和自动驾驶汽车上路,人们越来越不关心马力,他们关心尽可能获得最佳驾驶体验。司机正在寻找能够满足他们需求的系统,将开车转变为冒险......或休息,这就是汽车中的人工智能可以实现的。
车载数字助理最令人兴奋的一点是,它们的价值并不一定只存在于豪华车市场,令人惊叹的数字解决方案性价比高,也是如今可以实现的。如果做得好,车载数字助理会变得很有价值,以至于可能出现:人们无法想象没有它们的驾驶,就像很难想象Siri出现之前的生活一样。