欢迎光临散文网 会员登陆 & 注册

聊一聊一些荧幕和现场背后的音频故事(25)--我们是否利用好了数字音频的大动态优势?

2020-05-09 17:41 作者:盲人号  | 我要投稿

我们都知道,人耳对于声压的感知远没有有效做工来的直接

最直观的表现就是,比起非常大响度的现场,和刺耳的工地现场,我们的耳朵似乎更加

喜欢被“挠痒痒”的感觉,那么,是什么带来了这种有呼吸起伏的“挠痒痒”的质感那?

我觉得比起纯粹的电平,更应该是这个电平的”有效做工“

那什么是有效做工那?

这次专栏就来讨论下,我们是否利用好了,数字音频带来的大动态范围优势

以及,我们是否真的利用好了它



想要用物理介质来记录声音的历史,其实从50年的爱迪生时代发明留声机之后就开始了

1.唱片

最早的留声方式是通过在将波形在唱片上刻录的方式保留的

通过将电信号以物理形式记录的方式,人们实现了”保存“声音这个行为

但,这个声音依旧相较于现代的数字音频保存方式依旧有非常的局限性

首先,因为完全物理性的刻录,自然的,在物理上,这个记录中可能会因为热膨胀

针的磨损等因素导致记录中发生噪音,以至于被保存下来,加之因为还原过程多次播放会

因为发热/磨损导致记录的痕迹变得不再清晰,所以是一种非常古老而受限的保存方式

导致以当年技术保存的音频本身的“信噪比”非常的小

信噪比,英文名称叫做SNR或S/N(SIGNAL-NOISE RATIO),又称为讯噪比。是指一个电子设备或者电子系统中信号与噪声的比例。

用dB表示。例如,某音箱的信噪比为80dB,即输出信号功率是噪音功率的10^8倍,输出信号标准差则是噪音标准差的10^4倍,信噪比数值越高,相对噪音越小。

各因素影响信噪比的关系图

“噪声”的广义的定义就是:“在处理过程中设备自行产生的信号”,这些信号与输入信号无关。

对于播放器来说,信噪比都是一个比较重要的参数,它指音源产生最大不失真声音信号强度与同时发出噪音强度之间的比率称为信号噪声比,简称信噪比(Signal/Noise),通常以S/N表示,单位为分贝(dB)。对于播放器来说,该值当然越大越好。

响度:

单位为分贝(dB),

因为遮蔽效应的存在,要将一个声音的动态完全释放,并能够被人耳认知,需要在排除底噪的响度的前提下去将整体响度拉到一个能够完全释放一个音频动态的响度


换而言之:有效电平范围=  信号响度-底噪响度(NOISE

如果你希望一个还原播放的声音要能被以80db还原,而环境噪音在20db,你可能会需要将他的响度推到100db以上


这就意味着,在用唱片和早年的磁带机想要还原一个声音,我们通常会在后级添加非常多的电平以使得整体信噪比变得非常高。

但我们也知道,过度对一个信号增益会让一个音频变得“脏”而“热”,所以这种做法导致那个年代的存储介质在还原声音的时候存在非常多的失真和不确定因素

2.磁带

磁带是一种用于记录声音、图像、数字或其他信号的载有磁层的带状材料,是产量最大和用途最广的一种磁记录材料。通常是在塑料薄膜带基(支持体)上涂覆一层颗粒状磁性材料或蒸发沉积上一层磁性氧化物或合金薄膜而成。曾使用纸和赛璐珞等作带基,现主要用强度高、稳定性好和不易变形的聚酯薄膜。


录音机的磁头实际上是个蹄形电磁铁,两极相距很近,中间只留个狭缝。整个磁头封在金属壳内。录音磁带的带基上涂着一层磁粉,实际上就是许多铁磁性小颗粒。磁带紧贴着录音磁头走过,音频电流使得录音头缝隙处磁场的强弱、方向不断变化,磁带上的磁粉也就被磁化成一个个磁极方向和磁性强弱各不相同的“小磁铁”,声音信号就这样记录在磁带上了。

放音头的结构和录音头相似。当磁带从放音头的狭缝前走过时,磁带上“小磁铁”产生的磁场穿过放音头的线圈。由于“小磁铁”的极性和磁性强弱各不相同,它在线圈内产生的磁通量也在不断变化,于是在线圈中产生感应电流,放大后就可以在扬声器中发出声音。


直观结论:似乎模拟类存储介质都不可避免的会有非常大的本底噪音影响,导致如果在回放阶段试图将音量推进一个可“辨识”的范围,需要额外推出更多的电平才能达到,所以会导致的是, 为了听清一个原本在-40db上下的响度,你可能会需要将它的响度推至-60db以上,这样就会导致headroom非常,非常的小,以至于非常容易触及peak.


反观数字环境 也就是pcm编码


脉冲编码调制是70年代末发展起来的,记录媒体之一的CD,80年代初由飞利浦和索尼公司共同推出。脉码调制的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年由DVD

脉冲编码调制

讨论会发布和推出的。脉冲编码调制的位深度,从14-bit发展到16-bit、18-bit、20-bit直到24-bit;采样频率从44.1kHz发展到192kHz。PCM脉码调制这项技术可以改善和提高的方面则越来越来小。只是简单的增加PCM脉码调制位深度和采样率,不能根本的改善它的根本问题。其原因是PCM的主要问题在于:

(1)任何脉冲编码调制数字音频系统需要在其输入端设置急剧升降的滤波器,仅让20Hz-22.05kHz的频率通过(高端22.05kHz是由于CD44.1kHz的一半频率而确定)。

(2)在录音时采用多级或者串联抽选的数字滤波器(减低采样频率),在重放时采用多级的内插的数字滤波器(提高采样频率),为了控制小信号在编码时的失真,两者又都需要加入重复定量噪声。这样就限制了PCM技术在音频还原时的保真度。


我们知道 数字环境因为编码后的波形信号排除了模拟环境不可控的干扰,导致它能保证到一个非常大的信噪比,甚至是完全没有底噪,

所以,能保证一个非常充足的动态范围供录音,传输使用

16bit=96db       20bit=112db     24bit=144db    32bit=192db

32浮点=224db 

但是?

问题来了

我们真的用得到这么大的动态范围吗?

如果有录音经验的人应该会有一个概念,

比起去检测一个录音电平的总量大小,通过观测rms的大小来录音可以获得一个

有更充足后期空间的录音波形

这是为什么那?

这就要开始讨论有效电平和总电平了    

通过观察可以发现,通常而言,录音阶段的电平虽然因为有话放和数字环境响度提升的影响,能够让这部分录入时非常微小的电平比较容易达到一个耳朵可闻的响度,但用这种方式提升出来的电平本身是不会直接增加一个波形文件本身的rms,也就是一个波形的起伏

所以会导致这部分除了将原本音频推出更多原本很微小的的低频/高频信息外

并不会实质性给音频收入的内容增加更多”有效信息“

因为人耳对于中频的感受远比高低频敏感的多

加上因为压制在混合了非常多通道的音频信息后,因为

遮蔽效应,同样频率上共同发出的音频并不会互相提升听感,反而会让原本需要突出的”主要声“变得更加不明显

的原因,实际上在非常多轨道音频的混缩作业中,都会给到压缩器给每个不同的乐器/声源

加上,以cd标准的16bit中,总动态总量为96db,所以

留给人声的动态大概也就在20-24db上下,所以过度去用后级的话放/数字推子去增加一个人声/主奏的响度实际在提升它的听感方面反而会让它更加的”压缩感“而”干煸“


整点法子:1.对想要的音响效果做出预期,尽力在录音/音源阶段解决一个声音的音响效果,后期只需要对其进行小程度的压缩/均衡即可

2.在前级的增益上,我们应该选择性的不要把话放的增益推的过"热”,为音频保留足够的“动态余量(headroom)

3.其实不需要太纠结录音的数模转换单元本身的品质,以录音来说,96db的动态已经足够于90%的人能控制的响度范围,反而是一些控制噪音/环境混响,如果没有特殊需求就录制单声道就行了,以及如果觉得控制不住情绪会喷麦/录音太用力,记得在链路上添加limter

这些细节更能增加录音的成功率



聊一聊一些荧幕和现场背后的音频故事(25)--我们是否利用好了数字音频的大动态优势?的评论 (共 条)

分享到微博请遵守国家法律