超高采样率意义何在?(下)

前两篇文章中,我们提到了高采样率在避免录音和混音中的混叠失真、避免采样器信息缺失的作用。这些方面是偏向于技术性的,开发插件、音频接口的工程师也会帮你考虑到,只要你买的接口和插件是尽可能新的,一般不会有问题。但是接下来的部分,可能会涉及到设计操作中的事项,即使开发者有考虑到,也需要音乐人本身留意。
4. 母带制作中的过采样
母带制作的效果链中,最后一道关卡往往是限制器(Limiter)或者削波器(Clipper)。这里以限制器为例。 限制器的作用是在母带师推高总线的响度的同时,确保音频不会超过最大的0dB值。所以有人说限制器就是压缩比为∞的压缩器。在模拟时代的确是用很大的压缩比实现限幅,如著名的LA-2A光电压缩器,但现今的限制器已经不只有这一个区别了。在数字时代,限制器的核心功能除了要保护好音频文件的峰值不要炸、不产生削波,还要减少由于限制而带来的动态缺失的问题,因此很多限制器会对此有新的功能设计。

如何确保音频不会爆音呢?最简单的思路就是让所有采样点都保持在最高电平0dB以下——这样的思路很直观。但是,仅仅确保每个采样点不超过0dB,就足以决定音频不会超过0dB了吗? 看看这个例子:

对于一个16bit的信号,我们知道它一共有65536个量化的单位,这些单位分配给正负两边,则单边最大有32768个量化单位。如上图中所示,每个小方块就是采样点的具体位置,可以看到他们都不超过32768,即他们每个采样点都不会超过0dB的范围,换句话说:在44100Hz采样率下,这个文件的所有采样都没有产生削波。
但是我们耳朵听到的是声音,而不是采样。音频接口的DAC利用采样信号重建成模拟信号(图中的蓝色曲线),这个才是我们的模拟设备要播放出来的信号,这条蓝色曲线的峰值是波形的真峰值(True Peak)。

可以看到,由于采样率不够大,真实的音频峰值在两个采样点中间钻出来了,但是软件却无法实时识别到真峰值(计算真峰值是不能实时的,这也是个非因果的计算)。这种情况下也可能对播放设备产生损害,或者产生模拟领域的失真。

如何避开这种问题呢?FabFilter给出了方法:过采样(Oversampling)。
过采样就是通过内部重建信号的真实曲线,然后对这个真实的曲线进行更高精度的采样,通常是整数倍,比如2/4/8/16倍,FabFilter Pro-L 2 给出了最大32倍的过采样倍率使得插件能够识别真正的True Peak,进而获得理想的限制效果。

Pro-L 2的说明书中也说到了这一点,并推荐用户们使用4倍过采样配合0.1ms的Lookahead来控制真峰值。感兴趣的朋友可以阅读一下。

5. 过采样对信噪比的改善
采样率提升可以改善信噪比?是的。 这里的“噪”指的是量化噪声。之前文章讲过,量化噪声通常是类似白噪声的,量化噪声的功率平均分布在所有频段。当信号进行过采样时,量化噪声虽然总能量不变,但是由于它会散布到更广的频段内,量化噪声的一部分会被搬运到人耳不可分辨的高频率区域,相当于在人耳可听部分增加了信噪比。
让我们来看看下面例子: 这是一个轻柔的钢琴和弦录音,最后有松开踏板的声音,采样格式是44100Hz-24bit:

对这个录音直接降低比特精度,从24bit到8bit:

如果对原始音频先4倍上采样到176400Hz,再降低到8bit精度,结果是这样的:

通过四倍上采样,可以看到量化噪声一直存在着,而且在最高频部分散布,超过20kHz的部分直接认为不可听,但它们分担了大部分的量化噪声功率。从频谱图可以看到,这种情况下的8bit采样,钢琴的自然延音依然可以保存下来。
即使再重新降低采样率到44100Hz,量化噪声也相对更加友好一些,听起来不会有明显的频率突出来,噪声性质比较平稳,甚至还能存在更多的信息量。注意对比前面的8bit噪音。
当然8bit下什么样的声音都有点惨不忍睹:

说得再多不如听听吧,上面四个操作分别对应下面四个音频(全部标准化到合适的响度)分别是:
1. 正常的钢琴录音(44100Hz、24bit,微信中会被压缩):

2. 直接降低比特到8bit:

3. 4倍上采样到176400Hz,降低比特精度到8bit:

4. 4倍上采样到176400Hz,降低比特精度到8bit,再降采样到44100Hz:

可以听出来量化噪声上的区别。需要注意的是,这样的提升,虽然在工程上是被证明有效的,但是在音频制作的范畴通常并没有显著的效果——毕竟你不会用8bit采样深度去听歌,也很难找到超过48kHz采样率的音乐。所以这一点更多的是在电子工程领域被利用,而很少在音频制作领域被提及,我们在正常的制作环境下也不需要作过多考虑。
总结一下,超高的采样率的意义已经不在于人耳能不能直接听到那些超声波,而是在于:
1. 避免混叠(录音过程、混音过程都需要考虑);
2. 避免采样器/变调器处理音色时降低声音质量;
3. 避免采样间真峰值超过限制;
4. 提升信噪比。
实际上,对于量化噪声的处理,过采样并不是最好的办法。真正用于对抗量化噪声的工具是——抖动(Dither)。下期见。 *超高采样率的探讨到此告一段落,感谢大家的阅读和批评指正。
本文作者:艾夫
音乐制作人、编曲人、混音师、艾楽音乐工作室主理人、华中科技大学光电信息专业硕士。

*文中观点为作者独立观点,不完全代表本号立场,仅供参考交流学习;
*本文部分配图源自网络,不用于商业用途;如有侵权,请联系本号处理。