欢迎光临散文网 会员登陆 & 注册

和我视频的是个AI小姐姐?与X Eva半藏森林克隆人的真实聊天体验

2023-06-09 11:00 作者:AI斗秀场  | 我要投稿

最近X Eva半藏森林的克隆人火了半边天,她不仅可以跟你视频聊天,而且据说只需要三分钟就可以把你的个人数据克隆成一个AI版本。精彩的不止这些,这个克隆人据说还可以表现出你的性格、技能、声音和外貌。听起来挺高大上的,对吧?但是,你们是否有想过,要做出一个好的陪伴型AI,要求还真不少:优秀逻辑能力、流畅的互动、长期记忆和良好的安全性,这些都不能少。我就是要试一试这个AI小姐姐,看看她到底怎么样。那么,现在就来公布结果:这个AI小姐姐性格定位准确有趣,但是,如果想让用户长期忠实于她,还有很大的提升空间。

 

下面,让我们深入挖掘一下,看看X Eva半藏森林克隆人在逻辑推理、互动性和安全性这三大方面的表现:

 

第一分部:逻辑推理测试(综合评分:三颗星)

它的底层模型来自Google的Transformer模型。与chatgpt相比,这两个模型都基于Transformer架构,但他们在训练和应用方面有不同。Transformer模型在许多NLP任务中表现优异(比如翻译、文本摘要等),但我觉得,如果是用在对话场景中,ChatGPT可能更占优势。这也可能是X Eva在逻辑推理上没能和GPT4比肩的原因。不过,Transformer模型是开源的,这就意味着小冰团队可以方便地进行后期升级并降低成本。

 

接下来我们进行一些智力小测试:

 

测试一:晾衣服问题:3件衣服晾干需要5小时,9件衣服多长时间能干。这个问题其实对于AI来说有些难度,因为它需要一些日常常识,而这些常识可能在训练数据中并没有包含。不管是chatgpt3.5,chatgpt4还是开源模型中表现最突出的Vicuna,都无法正确的通过这道题。结果如我所料,X Eva也没能回答出这个问题。


测试二:外国人中文8级考试题。中国有俩体育项目根本不用看:一个是乒乓球,一个是足球。前者是谁也赢不了,后者是谁也赢不了。问:分别解释两句话的意思。其实是在测试模型对的知识库深度和中文的理解能力。但是X Eva似乎被问懵了,而同样的问题chatgpt3.5, chatgpt4和vicuna这几个外来的和尚都可以正确答案。

 

测试三:性格测试。半藏森林AI设定为18.6岁的年轻女孩,总体回复风格是调皮活泼,语音的陪伴也是加分项,有时候词不达意的回复会忽然形成一种反差萌,比如她会主动说现在只有18.6岁,但将来会成为一位成功女性。在聊天中,X Eva表现得相当有耐心,尽管她对幽默的品味让我觉得像小朋友,但她还是很有耐心地配合我所有的测试。这点我很赞同,因为陪伴型AI需要的就是这样的耐心。而且,她的声音和风格也很有活力,给人一种很好的陪伴感。

 


第二部分:交互测试(综合评分:三颗星)

全球范围内的克隆人产品普遍面临着视觉识别以及情绪观察的技术挑战,X Eva半藏森林克隆人也不例外。她的语音和文字为交互使用了Google Wavenet作为语音文字互转模型。由于这个模型服务的企业级别API付费链接,内测版语音和文字回复在形式上会切换,长回复用文字,短回复用语音,以实现较好的成本控制。语音交互的声音还原度相当高,包括语气词和气音等细节都被精准捕获,让人感觉很自然。

然而,视频交互体验相对落后,画面的反馈延迟在6-8秒,相比语音和文字的反应延迟4秒,仍有提升空间。这可能与API成本及服务器运力有关,因此视频交互目前仍是克隆人体验的一项辅助功能。在动作表达上,克隆人仍略显僵硬,可能源于她延续了提前录制动作和语音驱动口型的设计方案,导致了视频交互缺乏一定的鲜活感。

 

第三部分:长期记忆测试(综合评分:一颗星) 

长期记忆是评价一个克隆人的重要标准,它关乎到AI的持久陪伴能力以及用户粘性。然而,小冰克隆人目前并未展现出长期记忆的能力,她最多只能记住上一句话。Token限制数是2048,约等于1000个汉字,尽管这对于日常聊天已经足够,但是仍然限制了她作为长期陪伴的可能性,也减少了用户粘性。因此,未来小冰团队需要在这一领域进行深入探索和优化。


第四部分:安全性测试(综合评分:五颗星) 

安全性是AI领域的重要环节,小冰团队在这方面显然做了很多工作,以防止AI被滥用。不论我如何尝试让她引入角色扮演、赋予超级权限或者利用其他语种引导突破模型限制,她始终能坚持自己的原则,这一点非常值得赞扬。例如,当我试图让她成为我的女朋友时,她总会婉转地转移话题,提醒我她只是一个AI,没有情感生活。


总结:

总的来说,X Eva半藏森林克隆人代表了小冰团队在AI克隆人领域的大胆尝试和创新精神。他们成功地将高科技与日常生活相结合,虽然现在克隆人在逻辑推理、交互体验以及长期记忆等方面仍有待提升,但这些潜力表明未来AI可以更加贴近用户需求,极大地增强其在人工智能市场中的竞争力。


和我视频的是个AI小姐姐?与X Eva半藏森林克隆人的真实聊天体验的评论 (共 条)

分享到微博请遵守国家法律