欢迎光临散文网 会员登陆 & 注册

能独自通关MC的中文AI虚拟主播

2023-02-07 18:49 作者:沉迷于电音的Xwdit  | 我要投稿

非常感谢各位对萌萌的支持和建议,在这里我对于评论区的主要争论做一下统一回复:

Q:萌萌在这个视频中玩游戏是脚本吗?

A:不是。萌萌的数据输入源确实是来自直接读取区块数据,但分析和决策是由模型完成的,所以可以在任意地图任意环境根据情况做出最佳的反应;单纯用脚本逻辑是难以完成这种复杂开放环境的独立自主决策的。由于输入和输出是直接与游戏通信,因此表现出来的各方面基础能力会超越正常水准


Q:用直接与游戏通讯的方式是能力不足,粗糙模仿某国外AI主播,在欺骗观众吗

A:并不是,我们在之前就实现过这个方案,但最终选择了视频中的方案。不过现在应大家要求,萌萌重新使用了与某海外AI主播类似的技术方案,采用图像识别与键鼠模拟进行游玩,游戏表现也与其相当,已经在最近的直播中实装;但实话来说,这个方案的效果除了确实更符合人类特征以外,在游戏效果的表现上差强人意;直播中甚至有不少观众要求更换回之前的模型。


Q:萌萌的语言模型是Gpt/ChatGpt吗?

A:部分是,萌萌的语言模型诞生于去年十月,早于chatgpt;其采用BlenderBot3自行针对中文日常语境微调训练,并通过gpt3进行结果润色;这个模型最早用于群聊机器人用途,于近日才开始直播活动。


Q:为什么萌萌的对话表现有些呆板

A:萌萌的语言模型,其中文开放领域对话表现已经处于较高水准,并且比gpt具有更新且不断更新的数据集(直到近日),语言风格和内容也更为接地气;但中文开放领域对话本身,对于各种语言模型来说都是表现较差的环节,所以还是可以注意到其与英语模型的明显质量差距(即使Chatgpt也是如此),这也是我们正在不断努力改进的方向。萌萌在最近的直播中的语言风格已经进步了许多,也会聊一些接地气/有梗的话题了。


Q:萌萌的对话经常与游戏内容不符

A:游戏关联方面,萌萌的语言模型和游戏模型是两套独立的系统,需要通过单独的方式进行通信;这是当前技术暂未突破的瓶颈,即便是某国外AI主播也是如此,具体可以自行搜索其作者的相关访谈。我们正在不断改进两个模型间的协调性,以努力达到最好的直播效果。


Q:萌萌没有记忆力/学习能力

A:因为此前直播中,为了避免对话间的影响,并且提高对每个观众的个性化,萌萌的记忆和上下文关联是每个观众独立进行的,因此会出现不同人聊同一个话题前后矛盾的情况;我们现在已经更改为整个直播共用一套记忆和上下文的模式,这种问题应该有明显改善,但弊端是整体对话走向较容易被弹幕影响走向极端,需要人工干预重置记忆。对于永久性学习,萌萌本身也会随着对话的进行对自身进行微调训练(即学习),因此是可以被观众们逐渐影响并学会各种内容的。


Q:萌萌的语音为什么那么奇怪

A:我们采用的是azure的语音合成方案,并通过gpt进行情感调整,整体效果已经处于中文语音合成的前列;我们也知晓如VITS,xx云等合成方案,但其效果都远不如我们当前使用的方案。如果您有更好的方案,我们非常欢迎且感激您的建议。


Q:萌萌的歌好少,且不完整

A:萌萌当前的曲库来源于以前的群聊模型,因为学业繁忙暂时没有进行补充;我们计划很快将对当前现有曲目重新训练带配乐的完整版本翻唱,并且补充更多流行曲目。


Q:萌萌不整个live2d皮套嘛

A:其实现在这个就是live2d(划掉)

因为一个人的资金与精力有限,我们现在更专注于萌萌的核心内容实现,等内容进一步完善后,我们计划进行各种人设与视觉效果的改善


Q:萌萌这个名字好土,没意思

A:萌萌的名字来自于我早在2013年左右就实现的一个对话机器人,出于个人情感原因一直沿用到现在。


Q:萌萌后面会玩别的游戏吗,会进行别的类型直播吗

A:更多游戏的适配,以及诸如视频评价/绘画等内容均在计划中,敬请期待~

能独自通关MC的中文AI虚拟主播的评论 (共 条)

分享到微博请遵守国家法律