霜起——浅谈AI、中V与艺术创作
首先必须阐明这里的中V指的是虚拟歌手圈,包括以VOCALOID、Synthesizer V、ACE(开发了洛天依AI)等软件内部的歌手为创作起点的爱好者所聚成的圈子。不是虚拟主播圈!不是虚拟主播圈!不是虚拟主播圈!重要的事情说三遍。
2022年注定是中V与AI齐肩并行的一年,也是殊死搏斗的一年。这一切,从1月的《一梦千宵》说起。这一歌曲演唱者的声线和以往的中V歌手相比违和感和机械感大幅下降,在不到一周获得了170万播放。(虽然有原神IP加持,但是能在众多原神新春会单品中脱颖而出达成数据量第二已经很不错了)这一切的源头是ACE,它从18年白手起家,于21年成功提出基于AI神经网络的歌声模型,并完成了洛天依AI声库的建设。2022年5月,自从洛天依AI开放内测以来,中V得以再度掀起另一热潮,包括准传说曲《玫瑰与泪》与传说曲《账号已注销》《光与影的对白》与《啥啊》(传说指的是达成100w播放,这里不算入数据很明显是推广过的《Monster!Monster!》)



(以上引自萌娘百科)
AI声库在减少调校成本的同时也能拓宽调校的空间。原先我们想都不会去想的问题,如控制歌手的气声、假声等等(在传统音素拼接引擎如VPCALOID中根本不回去考虑)会成为调校的一大问题。而如果调校师能解决这个问题,歌曲的表现力会比原先的VOCALOID工程更上一个台阶,且更容易安利给V圈外的听众。
然而AI声库在热潮之下,存在有一些问题。其中之一,便是低门槛。
传统的音素拼接合成的歌曲若要做到高质量,不仅要弥补声库本身的缺陷,而且要通过拆音、换采样等各种手段模拟真实歌手口型的大小和发声部位的高低等,从而使声线更具有感染力。这种工作量极为庞大。而换为AI歌手则可省去大量的修声库bug的工作,(甚至不参与任何调校即可发布作品,当然不建议这样做),然而,这大幅降低了创作成本。不少低质翻唱(包括梗曲)抢占了VOCALOID·UTAU分区的大部分流量,甚至造成2022年第三季度数据前四全是梗曲。而这样的歌曲简单洗脑,基本没有营养价值,对于要入坑V圈的人而言是典型的逆催化剂。所以,如何设置门槛是我们需要思考的问题。
AI的另一个问题便是声音可塑性的下降。AI在自动处理发音问题的同时也会“像全民K歌的自动修音一样抹去调校者殚精竭虑画的参数”,最典型的例子便是onyk投稿的《牵丝戏》的翻唱,中间的几处戏腔感觉有戏腔但是又没有完全表现出来。又如COP的首个洛天依AI投稿《Reeeee--》画参时需要换采样,以削弱AI的自动修参带来的影响。所以,AI想要有表现力的难度要比VOCALOID大得多。
然而,从另一个角度看,AI的出现更能考验P主的审美能力和调校技能。(以下观点引自前夜Stellar)
虽然AI引擎(如Synthesizer V AI)有“AI重录”的功能,然而每一次重录,歌手声线的表现力都有细微的变化。而正是这一细微的变化,在无形之中决定了歌曲的表现力。很多人会听不出AI重录中每一个重录样本的区别。而只有经验丰富,而且视调校为一种内心真情实感的抒发的调校者方能把握住这一变化,从几百个样本中筛选出最适合的样本。所以AI的门槛貌似是低了,实际上在一定程度上,反而是“高”了。
随着洛天依AI与言和AI的出现,AI对中V的重生起到了不小的作用。然而剩下的路还需要P主、调校师和引擎开发人员等等的探索。
以上是随便写的,因为太久没发专栏,加上《霜起》的催稿,就写成这样了。我今年入坑中V,估计不能说得太多。