欢迎光临散文网 会员登陆 & 注册

两耳不闻白噪声?采样率、动态范围与实际应用

2021-09-28 08:57 作者:造音星球  | 我要投稿



上篇文章谈到了听觉极限对于采样率的影响,也介绍了奈奎斯特采样定理。它告诉我们,采样率要选择44100/48000Hz以上才能确保声音覆盖了人类的听觉范围。


至此我们知道了采样率对听觉的影响了,那,另一个“采样深度”会带来什么影响呢?


1. 采样深度回顾

 
所谓采样深度,指的是我们在对一个连续的波形的幅度进行量化编码的时候,设定的分割的精度,采样深度越大,则同样范围内采样点的幅度可以被定位得越精确,更接近原始波形。 


我在第一篇文章里放了一系列不同采样深度的音频试听,大家应该可以发现,随着采样深度的降低,有一种噪声越来越大。 是的,你听到的噪声就是“量化噪声”。 


量化噪声属于白噪声,它的意义是,在整个频谱内,各个频率的能量几乎一样,就像各种频率的可见光叠加的时候,就合成了白光。因此我们把这种噪声叫做白噪声。 


2. 量化噪声的产生

 


白噪声的频谱,是时时刻刻、全部频率都几乎为同一值的。这样的白噪声是怎么来的呢?或者说,什么样的条件下会产生白噪声? 


答案是:服从均匀分布的随机数。 


好吧,这个说法有点绕。让我们来看看量化的时候,信号到底发生了什么变化。 下图说明的是一个正弦波(蓝色曲线)上的准确的点(红色圈)在幅度量化的过程中,被量化为固定栅格上的值(黄色的点)。


正弦波的量化(以0.1位量化精度)


可以放大看看细节部分:


量化过程中产生误差


红色的点,由于系统设定,被迫离开了自己的真实值(0.14112…),而附着在了就近的格子上(0.1)。 


可以说,几乎所有信号上的幅度都不是准确的整数(有限小数),把它们近似为一系列的固定的刻度是量化中必要的步骤。但是,这样的量化肯定会引入误差,这个误差会在多大程度上影响音频的听觉体验呢?这个性质就是我们需要探讨的。 


量化产生的误差可以直接由采样信号和原始信号作差得到。如图所示:


正弦波与0.1精度量化后的误差

当然,正弦波还是比较规则的,因此出来的样子还是具有周期性,如果我们使用一个普通的音频文件进行测试的话,结果就是:


上图为原始波形,中图为4bit采样,下图为两者之差


数据不会骗人,误差也是肉眼可见的,当然耳朵也一样能听出来。我们把噪声部分再放大:


放大后的误差图象


所有误差点的位置都是几乎随机的,每个点随机散布在大约-0.03~+0.03之间。恰好,4bit采样下的单位精度就是0.625,四舍五入的时候这个差值要不就比量化的位置高半格,要不就低半格,所以量化噪声的波动范围就在一个量化精度之间。由于音频信号的内容丰富,频率和幅度多变,因此在大的样本下,量化产生的噪声为白噪声。 


3. 动态范围


了解了量化噪声之后,动态范围的概念就可以引入了。动态范围指的是,一个音频文件中可以记录的最大音量的电平和最小音量的电平的关系。以16bit为例,如下图所示,动态范围就是数字音频能记录的最大的电平65536到最小电平1的比例,工程上一般用对数表示,实际上就是最大到最小的比值取对数,并乘以20(功率需要平方)。通过计算可以得到:4bit记录的动态范围为20*lg(2^4)=24dB;8bit采样深度记录的动态范围为20*lg(2^8)=48bit;以此类推,16bit采样深度记录的动态范围是96dB、24bit可以记录144dB。 



动态范围越大,我们越能记录小音量的信号。想象一下,一个波形如果信号微弱,比如只能占用3个量化单位,那么一个正弦波会被记录成这样: 



带来的后果就是,采样波形的噪声足以影响这个正弦波的记录! 


所以如果我们有更细致的量化深度,就会减少这种误差了。从结果上看,就是让量化噪声减少到我们不可察觉的量级。 


4. 采样率、动态范围与实际应用

 
多数情况下,音乐的动态范围大约从40dB到105dB都有可能。响度大的电子、摇滚音乐动态小一些,古典管弦乐动态会大一些。当你聆听小动态音乐的时候,可能不需要很高的量化精度,16bit足以使用。但是当你听大动态的交响乐的时候,16bit对应的96dB的动态范围就显得不足了。 


从录音上讲更是如此。现今流行的音频接口的AD/DA动态范围可以达到120~130dB,即使是入门级别的小声卡也可以轻松实现110dB的动态范围,此时16bit的录音提供的96dB就无法匹配声卡的性能上限,多出来的这20多dB的余量会被浪费。 


同时,由于录音的时候出于保护音频质量考虑,往往不会把输入电平打到非常高,有的架子鼓录音、电影音效和同期声录音等甚至会把峰值的余量留到-12~-20dB。假如你为了保证有20dB的余量,却使用16bit录音,其实只能利用其76dB的范围。而在24bit的录音中,即使你预留了20dB的余量,依然可以拥有144dB-20dB=124dB的动态范围,此时的量化噪声完全可以忽略,声卡的性能也得以释放。 


至于32bit的精度,以此类推可以获得192dB的动态空间。需要注意的是,32bit和32bit float(浮点)是不一样的。现在的音频接口通常最多使用32dB float的精度,它的意义是,在不改变24bit的精度下,额外增加了0dB上方48dB的余量。录音的时候往往担心录爆(超过0dB的信号全部被抹平为0dB),此时则完全不用担心。但是它能记录的最小电平是和24bit精度下一致的,也就是说,量化噪声并不会降低。但是噪声是相对的,我们只需要确保信号和噪声相比占主要部分就好。在这个情况下,量化噪声往往会被音频接口中的本底噪声、录音环境噪声所掩盖。


左边的32bit float波形,可以记录超过0dB的信号,而右边的24bit波形,则最多记录0dB,超出的部分直接削波(Clip),正弦波的形状无法正确保存。 


在数字音频工作站(DAW)中,一些宿主还可以提供更高的内部处理精度,这是为了避免插件运算时引入不必要的噪声和削波而设定的。比如Studio One可以提供最大64bit float的内部处理精度,这样你在宿主中偶尔出现超过0dB的音量增益也可以被容忍,只要你在母带阶段把总线的峰值控制住就好。 


同样,宿主内部的采样率也可以提升到很高,比如384kHz,这样的高采样率则可以防止欠采样、真峰值产生Clip等现象,同时高采样率也可以降低量化噪声。 


总之,对于采样深度的理解和运用,我们需要记住:在录音阶段尽量使用24bit以上的深度;在母带输出时,根据作品最终的载体(CD/DVD/流媒体)选择对应标准下的深度。其他细节问题,比如抖动(Dither)等暂不在本文范围。


本文作者:艾夫

音乐制作人、编曲人、混音师、艾楽音乐工作室主理人、华中科技大学光电信息专业硕士。

*欢迎原创投稿,详情请联系本号后台;

*文中观点为作者独立观点,不完全代表本号立场,仅供参考交流学习;

*本文部分配图源自网络,不用于商业用途;如有侵权,请联系本号处理。


两耳不闻白噪声?采样率、动态范围与实际应用的评论 (共 条)

分享到微博请遵守国家法律