【教程】分离人声,消除背景音乐,保留人声
最近考虑能否分离人声和背景音乐,相信很多剪辑视频的朋友都需要,这里抛砖引玉总结一下:
一、云猫转码
收费
二、spleeter
基于深度学习TensorFlow开发,地址:
https://github.com/deezer/spleeter
安装教程:https://zhuanlan.zhihu.com/p/149944571
如果提示这个错误:

原因是numpy版本问题,可以手动输入下面命令解决:
pip install numpy==1.19.5
采用了这个算法的软件还有:
https://www.izotope.com/en/shop/rx-8-standard.html
https://www.steinberg.net/spectralayers/
https://acondigital.com/products/acoustica-audio-editor/
https://www.virtualdj.com/stems/
https://www.algoriddim.com/apps
所以我的意思你懂吧,上述采用这个算法的那些软件,的破解版本,你们随便找,自己悄悄用就行了。
spleeter这个算法的软件在Windows和Mac都有GUI版本,也就是图像化操作界面,不用学我搞代码输命令。
但因为我用Mac我只提供Mac版本GUI软件下载地址:
https://github.com/kyab/MySpleeter/releases/download/20200904_2/MySpleeter20200904.dmg
Windows版本的GUI界面版本自行搜索,这里给个百度网盘地址(随时可能失效)
链接:https://pan.baidu.com/s/160AoGnmUGl7vB6N7yY5aTg
提取码:2a43
三、https://vocalremover.org/
这个网址和云猫的算法几乎是一模一样的,哪个网址能打开就用哪个
类似的在线转换网站还有:
https://www.lalal.ai/
https://ezstems.com/
https://moises.ai/
https://melody.ml/
四、AU传统方法
用Adobe Audition这个软件打开音频文件,从“效果”里面选 立体声声像→析取中置声道
保持默认配置,下方的“频率范围”选择预设的“男声”“女声”其一
然后拖动右方的两个滑块……
但效果不是很拔群
这里我推荐用Spleeter本地安装的方式,想用GUI版本的不用看了:
假设你已经安装完成,首先建立一个工作目录,我就叫它spleeter,下面建立一个目录pretrained_models,然后再放一个你要分离的音频文件,这里我是test1.mp3

然后pretrained_models文件夹下药下载并解压文件,下载地址在https://github.com/deezer/spleeter/releases
我这里下载了最通用的2stem分离,就是人声和背景声,你们可以对应建立不同的版本

解压后的目录结构:

一切准备妥当,运行命令即可:在该conda环境下,先cd到spleeter工作目录后,再执行
spleeter separate -i test1.mp3 -p spleeter:2stems -o output
之后得到结果:


其中vocals是人声,accompaniment是背景声。
在考虑出个教学视频或者效果演示视频,留言点赞多久出一期