关于一些碎碎念。
没想到被推起来围观了。因为只是做着自己玩的,有点慌。(以下内容纯主观意见,如有异议欢迎指教讨论。)
首先就是歌叽歌叽这个软件,我给他最通俗的一个比喻就是AI换音。和现在的AI换脸类似。歌叽歌叽能根据提供的采样,进行音色(应该是共振峰学习)和口型学习,然后将已经建模好的曲库样品进行学习还原。因此歌叽歌叽的自定义AI歌手,暂时只能生成提供的建模曲库内容,并且可编辑度为0。源采样的质量就很重要。
自己使用的设备是M1 MacBook Air + VOCALOID 5 +歌叽歌叽iOS版旁载。系统内录VOCALOID 5的采样去给歌叽歌叽学习。
然后就是关于Len的效果能这么好也是出乎我的意料。说明V4x的采样质量不错。之前自己也做过类似的尝试ーー就是将VOCALOID采样放进歌叽歌叽进行学习。因为跨语种还是有点麻烦的,就一直咕着,昨天就心血来潮填了试试看。所以,跨域种的老师们你们还没失业呜呜呜,我也是跨语种捏出来的学习源采样。
哦,顺便提一嘴,昨晚还试了直接用Len的工程文件换Rin然后去给歌叽歌叽学习,结果大失败。完全没有一点Rin的感觉,音色和口音完全就是底部建模大放送。可能是源采样口音太大了,没有对应上建模(关于跨语种工程不兼容这件事),机器学习失败了。
这算也算是个门槛不高的技术下放民间系列,人人都能做,问题也很明显就是音质问题,所以也只能图个乐。想要效果尽可能好的话,源采样质量就要尽可能的高。
最后求求各位:
不要对比!不要引战!不要拉踩!
听个乐就够了(。_。)发展不太对了的话,UP随时可能因为过敏删稿跑路(
Love and Peace. Have Fun.