B站视频环绕声转杜比全景声与常规Mono/Stereo音频流处理小心得
当前B站视频稿件的音频支持 Dolby Atmos 和 Hi-Res,投稿时音频流参数需符合要求,否则一律按照普通音频处理,无差别二压,且二压后音质明显下降。这直接导致本人不得不改变上传视频时对音频的处理策略。个人认为,某些特定的稿件内容,音质需要得到一些基本保证。

▼ 已经过时的本人以前处理音频策略
B站以前的音频规格要求明确写明:码率 ≤ 320 kbps,声道数 ≤ 2。凡符合此条件的常见格式音频 (具体有什么忘了反正就是那些) 均不二压。如此,根据本人常上传的音频规格,以前的音频处理策略如下:

2022 年 12 月左右,B站开始普通音频全面二压,二压后码率几乎是原音频折半,且高频部分明显糊掉,效果不好。尤其是 72k 的 Mono, 本身码率就低,压完后效果极差。本人一直自认为是对音质方面没有极致追求的人,远不像发烧友那样吹毛求疵。但B站二压效果实在太烂,以致于本人都听出来了,于是开始尝试 Hi-Res 和 Dolby Atmos 音频上传。

↖普通音频全面二压前本人投稿最后一个未音频二压的视频|普通音频全面二压后本人投稿第一个遭遇音频二压的视频↗

▼ 测试后本人当前处理音频策略
B站触发 Dolby Atmos 或 Hi-Res 音频选项的条件如下 (摘自投稿页面, 小字本人注):
▽ Dolby Atmos
・全景声音轨
・音频编码格式 E-AC-3 (Dolby Atmos)(即 E-AC-3 JOC)
・音频声道数 6 (5.1) 或者 8 (7.1)(所以不包含天空声道?)
・推荐音频采样率 48 kHz
・音频码率 320 以上 kbps
▽ Hi-Res 无损音质
・音频编码格式: alac / ape / dts / flac / mlp / mp4als / ralf / shorten / tak / wavpack / wma lossless / pcm
・音频采样率: 不低于 48 kHz
・音频位深度: 不低于 24 bit
由于本人投稿内容中音频规格基本基本都是低于以上要求的,因此想要触发以上音频选项,需要强行升格。本人不使用算法,仅仅是丢进 Au 或 DaVinci 内简单输出,这个思路类似于视频方面将 1920×1080 的视频不使用算法直接 upscale 到 2564×1442 来触发 4K 档画质选项以获得更高的码率上限的做法。

Dolby Atmos 和 Hi-Res 选项需要大会员在支持的设备上才能启用,而触发这两个选项的稿件中二压出来的普通音频音质也较好,总之比 aac 直传效果好。
那为什么直传 aac 二压出来效果就差,不知道。
环绕声转 Dolby Atmos 的思路本质上就是借杜比全景声来实现环绕声的效果。事实上在日本,能够配置出 22.2ch 环境的家庭也极少,因此松下和 Dolby Japan 已经研发出能将 22.2ch 音频转为 Dolby Atmos 输出的录像机,参见 https://www.jas-audio.or.jp/journal_contents/journal202201_post16626

22.2ch 转 Dolby Atmos 5.1 的视频, 22.2ch 研发与应用的目的——「臨場感」的效果能很好地还原

▼ 22.2ch 音频各声道在 Dolby Atmos 声像器中的摆放位置
目前已有 DaVinci Resolve 17 及以上 和 Nuendo 8 及以上 等专业软件同时支持 22.2ch 和 Dolby Atmos。以 DaVinci Resolve Fairlight 为例,本人的做法大致如下:
抽出 22.2ch 音频中 24 条声道的 PCM,因为一般情况下,我们能接触到的 22.2ch 音频是 AAC_LATM 格式,无法直接导入 DaVinci。
在 DaVinci Resolve Fairlight 中新建一条时间线,包含 24 条 Mono 轨,依次将 24 条声道的音频文件摆入。
总线格式设为 Dolby Atmos。
将 24 条轨链接编组,DaVinci 会自动识别为 22.2 Surround,编组完成后各条声道自动被赋予各自的坐标。具体如下:
Ch|Label|L/R▽|F/B▽|D/U▽
・・|・・・・・|・・・・|・・・・|・・・・
01|FL...|100L|100F|...C
02|FR...|100R|100F|...C
03|FC...|...C|100F|...C
04|LFE1※|100L|100F|...C
05|BL...|100L|100B|...C
06|BR...|100R|100B|...C
07|FLc..|.50L|100F|...C
08|FRc..|.50R|100F|...C
09|BC...|...C|100B|...C
10|LFE2※|100R|100F|...C
11|SiL..|100L|...C|...C
12|SiR..|100R|...C|...C
13|TpFL.|100L|100F|100U
14|TpFR.|100R|100F|100U
15|TpFC.|...C|100F|100U
16|TpC..|...C|...C|100U
17|TpBL.|100L|100B|100U
18|TpBR.|100R|100B|100U
19|TpSiL|100L|...C|100U
20|TpSiR|100R|...C|100U
21|TpBC.|...C|100B|100U
22|BtFC.|...C|100F|100D
23|BtFL.|100L|100F|100D
24|BtFR.|100R|100F|100D
※ 两 LFE 在声像器中坐标与 22.2ch 标准文档中 Subwoofer 摆放位置不同:在现实中,两 Subwoofer 摆放在下层。
Bus Out 全部分配到 Dolby Atmos Send 的 Beds,Track Direct 中 24 个音频 (即 22.2ch 的 24 个声道) 全部分配到 Dolby Atmos Send 的 Objects。
播放时,在空间方位检视器中,可以看到分布在空间中的 22 个普通声道;在输出电平中,可以看到总线的 LFE 有信号,且 22.2ch 和 Dolby Atmos 的电平 (尤其是 FL, FR, FC) 相似;渲染出的 Dolby Atmos ADM BWF 文件在 MediaInfo 中可以读出各个 Objects 的信息。

制作出格式为 E-AC-3 JOC 的 Dolby Atmos 音频的详细步骤,参考 @izwb-003 大佬搬运和录制的教程即可。5.1ch 音频已经很常见且只有一个平面,转 Dolby Atmos 更简单。

@izwb-003 大佬搬运和录制的一些教程

本人以前基本不碰音频,也不是发烧友,很多东西最近才开始了解学习,如有误请指教。