欢迎光临散文网 会员登陆 & 注册

linux ubuntu上运行uvr5人声分离器

2023-06-11 09:19 作者:CiiLii西里站长  | 我要投稿

1. inux ubuntu运行uvr5人声分离器

github地址: https://github.com/NanKeRen2020/UVR5_Linux

安装&运行

这些说明适用于安装 UVR 5.4 的用户,也许 UVR 5.x 也可以工作,需要 python 3.8/3.9。

sudo apt-get 安装 sox

sudo apt-get 安装 ffmpeg

  1. 克隆源代码。

    pip install --no-cache-dir -r requirements.txt

    pip 安装 torch==1.9.0+cu111 torchvision==0.10.0+cu111 torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html

  2. 通过应用程序中的“设置”菜单下载模型或从原始项目 [1] 下载。

  3. 运行python3.9 UVR.py,主界面如下图


2. Windows 安装


关于

此应用程序使用最先进的源分离模型从音频文件中去除人声。UVR 的核心开发人员训练了此包中提供的所有模型(Demucs v3 和 v4 4-stem 模型除外)。

  • 核心开发人员

    • 安祖07

    • aufr33

  • 支持项目

安装

这些包包含 UVR 接口、Python、PyTorch 和其他有效运行应用程序所需的依赖项。不需要先决条件。

Windows 安装

  • 请注意:

    • 此安装程序适用于运行 Windows 10 或更高版本的用户。

    • 不保证运行 Windows 7 或更低版本的系统的应用程序功能。

    • 不保证 Intel Pentium 和 Celeron CPU 系统的应用程序功能。

    • 您必须将 UVR 安装到主 C:\ 驱动器。将 UVR 安装到辅助驱动器会导致不稳定。

  • 通过以下链接下载适用于 Windows 的 UVR 安装程序:

    • 主要下载链接

    • 主下载链接镜像

  • 已安装 UVR 的更新包说明:

    • 如果您已经安装了 UVR,则可以在其上安装此软件包或直接从应用程序下载。

Windows 手动安装

安装

  • 请注意:

    • 此捆绑包适用于运行 macOS Catalina 及更高版本的用户。

    • 不保证运行 macOS Mojave 或更低版本的系统的应用程序功能。

    • 不保证旧版或廉价 Mac 系统的应用程序功能。

    • 安装完所有内容后,应用程序可能需要 5-10 分钟才能首次启动(取决于您的 Macbook)。

  • 通过以下链接之一下载适用于 MacOS 的 UVR dmg:

    • 主要下载链接

    • 主下载链接镜像

    • 主要下载链接

    • 主下载链接镜像

    • Mac M1(arm64)用户:

    • Mac 英特尔 (x86_64) 用户:

    MacOS 用户:打开 UVR 时遇到问题?手动 MacOS 安装

    Linux安装

    请参阅 Linux 安装说明

    其他应用笔记

    • Nvidia RTX 1060 6GB 是 GPU 转换的最低要求。

    • 建议使用至少具有 8GB V-RAM 的 Nvidia GPU。

    • 目前不支持 AMD Radeon GPU。

    • 此应用程序仅与 64 位平台兼容。

    • 此应用程序依赖于 Rubber Band 库的时间拉伸和变调选项。

    • 此应用程序依赖 FFmpeg 来处理非 wav 音频文件。

    • 该应用程序将在关闭时自动记住您的设置。

    • 转换时间将在很大程度上取决于您的硬件。

    • 这些模型是计算密集型的。

    更改日志

    最近的变化:

    • 修复了下载中心型号列表问题。

    • 修复了合奏模式下的音频片段。

    • 修复了集成模式下的输出模型名称问题。

    • 为 MDX-Net 添加了“批处理模式”以提高性能。

      • 批处理模式的内存效率更高。

      • 无论批量大小如何,批处理模式都能产生最佳输出。

    • 为 VR 架构添加了批处理模式。

    • 为 Demucs 添加了混音器模式。

      • 此选项可以改进某些 4 杆模型的分离。

    从 UVR v5.4 到 v5.5 的修复和更改:

    • 进度条现在与应用程序中的每个进程完全同步。

    • 拖放功能现在应该每次都能使用。

    • 用户现在可以将大量文件和目录作为输入。删除目录后,应用程序将搜索任何具有音频扩展名的文件并将其添加到输入列表中。

    • 固定低分辨率图标。

    • 添加了在应用程序无法连接到 Internet 时手动下载模型的功能。

    • 下载中心的各种错误修复。

    • 各种设计变更。

    表现:

    • 模型加载时间更快。

    • 导入/导出音频文件更快。

    新选项:

    • “选择保存的设置”选项 - 允许用户保存整个应用程序的当前设置。您还可以加载保存的设置或将它们重置为默认设置。

    • “右键单击”菜单 - 允许快速访问重要选项。

    • “帮助提示”选项 - 启用后,用户可以将鼠标悬停在选项上以查看描述该选项的弹出文本。右键单击选项还允许复制“帮助提示”文本。

    • 二级模型模式 - 此选项是仅适用于 MDX-Net 的“Demucs 模型”选项的扩展版本。除了现在,此选项在所有三个 AI 网络和任何词干中都可用。任何模型现在都可以是次要的,用户可以选择它对最终结果的影响程度。

    • 集成模式的强大缓存,允许更快的处理时间。

    • 单击“输入”字段将弹出一个新窗口,允许用户浏览所有选定的音频输入。在此菜单中,用户可以:

      • 删除输入。

      • 验证输入。

      • 创建选定输入的样本。

    • “示例模式”选项 - 允许用户仅处理轨道的一部分以示例设置或模型,而无需运行完整的转换。

      • 括号中的数字是生成样本的当前秒数。

      • 您可以在“其他设置”菜单中选择从曲目中提取的秒数。

    虚拟现实架构:

    • 能够切换“高端处理”。

    • 支持最新的VR架构

      • Crop Size 和 Batch Size 专门针对仅使用最新架构的模型。

    MDX-网:

    • “降噪输出”选项会产生更清晰的结果,但处理时间会更长。此选项已取代降噪。

    • “光谱反转”选项使用光谱反转技术来获得更清晰的二级词干结果。此选项可能会减慢音频导出过程。

    • 辅助词干现在具有与主词干相同的截止频率。

    Demucs:

    • 现在支持 Demucs v4 模型,包括 6 杆模型。

    • 仅当用户未选择“所有词干”时才组合剩余词干而不是将选定词干与混合物反转。

    • 一种“预处理”模型,允许用户通过强大的声乐或乐器模型进行推理,并将剩余的词干从其生成的乐器混音中分离出来。此选项可以显着减少其他 Demucs 生成的非人声词干中的人声渗出。

      • 预处理模型旨在用于除人声和乐器之外的所有词干的 Demucs 分离。

    合奏模式:

    • 集成模式已扩展为包括以下内容:

      • “平均”是一种对最终结果进行平均的新算法。

      • 合奏中的无限模型。

      • 能够保存不同的合奏。

      • 能够为所有单独的词干类型集成输出。

      • 能够选择独特的集成算法。

      • 能够一次集成所有 4 个 Demucs 词干。

    故障排除

    常见问题

    • 如果未安装 FFmpeg,如果用户尝试转换非 WAV 文件,应用程序将抛出错误。

    • 内存分配错误通常可以通过降低“块大小”来解决。

    问题报告

    发布新问题时请尽可能详细。

    如果可能,点击“开始处理”按钮左侧的“设置按钮”,点击“错误日志”按钮,可以提供给我们详细的错误信息。

    执照

    Ultimate Vocal Remover GUI代码是MIT 许可的。

    • 请注意:对于所有希望使用我们模型的第三方应用程序开发人员,请通过向 UVR 及其开发人员提供信用来遵守 MIT 许可证。

    学分

    • DilanBoskan - 你在这个项目开始时的贡献对 UVR 的成功至关重要。谢谢你!

    • Bas Curtiz - 设计了官方 UVR 徽标、图标、横幅和初始屏幕。

    • tsurumeso - 开发了原始的 VR 架构代码。

    • Kuielab & Woosung Choi - 开发了原始的 MDX-Net AI 代码。

    • Adefossez & Demucs - 开发了原始的 Demucs AI 代码。

    • KimberleyJSN - 为 MDX-Net 和 Demucs 的训练脚本的实施提供建议和帮助。谢谢你!

    • Hv - 帮助将块实现到 MDX-Net AI 代码中。谢谢你!

    贡献

    • 对于任何对Ultimate Vocal Remover GUI的持续开发感兴趣的人,请向我们发送拉取请求,我们将对其进行审核。

    • 这个项目是 100% 开源的,任何人都可以免费使用和修改。

    • 我们只维护对Ultimate Vocal Remover GUI和提供的模型的开发和支持。


    linux ubuntu上运行uvr5人声分离器的评论 (共 条)

    分享到微博请遵守国家法律