【SoVits4.0/ai翻唱/星野爱】up主训练了26个小时的星野爱翻唱模型,
2023-07-16 22:49 作者:FullOfBugs | 我要投稿

我对着大家的建议试了半天之后发现。单单把懒人包里面的.json的语句增加
"speech_encoder": "vec256l9", //如果是Vec768模型,这一项改为"vec768l12"
"speaker_embedding": false
不能解决推理出来的充满电音的问题,改成图中所示的就可以了。

也就是把
"n-speakers": 3,
改成
"n-speakers": 2,
删掉"DongXueLian": 0,
下边的
"Hoshino AI": 1,
"Hoshino AI V2": 2
改成
"Hoshino AI": 0,
"Hoshino AI V2": 1