欢迎光临散文网 会员登陆 & 注册

畅想一下 AI 合成歌声技术的未来

2022-09-15 16:37 作者:陌辞寒  | 我要投稿

这几年 AI 合成歌声技术(下文简称 AI 合成)发展得很迅速,我认为在现在这个时间点(2022 年下半年),AI 合成已经没必要只朝着像人声的路上继续走了。

一是边界递减效应是很恐怖的,比如从 98% 到 99% 像人声的难度,可能远比从 90% 到 98% 像人声难,就像用 AI 识别物体,准确率提升到一定程度后就非常难提升了。如果以像人声的标准来衡量,就会发现 AI 合成的发展会变慢甚至停滞。(比如我们会看到这样的讨论,即使再过几年。a:这首合成的歌真像人声啊。b:有不少细节明显有合成的痕迹,一耳朵就听出来了。)

二是像人声并不是一个具体可靠的标准,不同人的声线以及唱歌的方式都不一样,有些人甚至一唱歌就跑调,像这样的人声并没有价值。而且人声有一些难以避免的缺点,不然人声后期也不至于那么麻烦,AI 合成没必要为了像人声把那些缺点也一起学去,给大家制造麻烦。

三是仅仅像人声并没有足够高的竞争力,就像很多人会唱歌,但能火起来或者至少能靠唱歌赚钱的歌手并不多,人都不是像人而是是人了,照样没有竞争力。即使从降低成本的角度看,找那些没什么名气的小歌手成本也未必高,转向 AI 合成未必能节省成本。如果只是在创作歌曲时录制 demo,那么也并不需要很高的标准,可能现在的技术已经足够了。

所以 AI 合成继续发展的话,就要具有人声所没有的优势,而且这优势不能只是一些特色(传统的声库一样有不少特色),而是有商业价值的优势,而且仅仅成本低这一点肯定是不够的。

让 AI 合成出真人发不出来的声音是一个方向,但“真人”是一个非常宽泛的概念,比如有些人会口技,模仿各种乐器都惟妙惟肖,如果是人类完全无法发出的声音,那么其实是挺困难的,或者很难符合大部人的喜好。朝这个方向走,很容易又陷入传统声库受众小的境地。所以我认为 AI 合成的优势不能只体现在声音局部的特点上。

AI 其实并不擅长处理具体的细节,而更擅长整体的事情,尤其是对人类来说工作量巨大的事情。所以我认为从这个角度想就可以找到 AI 合成的优势。

比如现在的一首歌,对我们来说基本是固定的,虽然每个歌手的唱法会有一些差异,但还是相同的地方居多,同一个歌手唱多遍的效果就更接近了。但是 AI 合成是可以实现每一次唱都有明显差异,同时我们又能听出来这些不同的版本有一些共同点,就像一首歌的不同版本。这样一首歌就不再是死的,而是活的。甚至听众不再只能被动地听歌,而可以通过交互来改变听到的内容,同时不需要任何专业知识(比如在听歌时随便感叹几句,或者通过表情和动作的变化,就可以改变这首歌后边的内容,或者下一遍听到的内容)。如果能实现这一点,那么对现有的音乐行业可能会产生不小的冲击。我称这种歌曲为“互动式歌曲”,而这种歌曲如果不借助 AI 的力量,制作成本是非常高昂的,基本不可实现。

还可以更激进一些。即使是上边的互动式歌曲,听众的主动权依然是比较小的,大家依然需要去到处找自己喜欢的歌。而 AI 的发展可以改变这种流程,改变听众和歌曲的这种消费者与消费品的关系。比如某个人今天心情比较好,想听开心的歌,现在基本要么去听自己以前听过的开心的歌,要么去找新的开心的歌(比如各种软件的分类或者推荐之类,可能找了半天才遇到一首喜欢的,到那时开心劲早过去了)。这就像一个人今天开心想吃顿大餐,要么点以前吃过的菜,要么点以前没吃过却在菜单上的菜,自由度是很低的。但 AI 可以让他定制自己的需求,比如他很开心地说一些话或者做一些动作后,AI 通过海量的数据实时生成了一首刚好符合他此刻状态的歌,而他在听这首歌时,依然可以继续反馈来改变这首歌。这就像一个人想吃大餐了,直接找到他的私人厨师定做,而且吃的过程如果不满意还可以随时调整。

虽然现在看起来这些想象有些天马行空,但从技术难度上看,未必比让 AI 合成的歌声非常像人声更难,只是方向不同。而且不需要做得多么极致就可以满足很多人的需求了,就像很多听众听听流行的口水歌就满足了,不需要多么高雅或者技术含量多么大的音乐。而实时合成那些要求并不高的为私人定制的音乐,未必很难。(举例来说,现在 AI 合成图画的技术已经可以让很多人惊叹了。)

所以我认为 AI 合成出足够像人声的音乐不是终点,而是起点。正因为足够像人声了(可能 90% 像人声对大部分人来说就已经可以接受了,喜不喜欢这首歌的原因不再和是否像人声有关,而是是否喜欢旋律、声线、歌词、风格等等),才能得到大众的支持。一旦满足了大众的要求,就可以往 AI 更擅长的方向发展,比如为私人定制可交互的音乐,或者让对音乐相关技术不了解的人也有能力靠自己创作出歌曲(而不用像现在这样需要找其他分工的人)等等。


畅想一下 AI 合成歌声技术的未来的评论 (共 条)

分享到微博请遵守国家法律