【AI翻唱/变声/整合包】有张N卡就能跑!媲美So-VITS却不吃配置,全新的D

DDSP-SVC 3.0指南笔记
效果对比
DDSP-SVC
01:44

SoVITS 4.0
01:01

数据准备
03:39
1.时长1~2小时(最低不低于30分钟)。
2.人声干声(无伴奏和声等,可使用UVR5取得)。
3.音频格式为WAV(似乎现在兼容了MP3)格式。
4.音频切片,控制声音尽量不要包含空白或者杂音
注:UVR5如果你的版本下载后发现没有视频中的模型可能需要下载(需要科学上网)或者在b站搜UVR5从网上下模型
