欢迎光临散文网 会员登陆 & 注册

“采”到多深好?浅析奈奎斯特采样定理

2021-09-26 08:51 作者:造音星球  | 我要投稿



在“采样”系列第一篇文章中,我介绍了计算机如何把模拟的声音信号转化为离散的数字的信号。在这个过程中,即使我们假设设备工作理想,也会出现一些限制和偏差。比如:将连续的模拟信号在很短的时间内采样为数字信号,以及把信号的幅度分割为非常小的单位进行量化。我也给出了一系列的音频供大家进行比对。现在我就要解答剩下的问题——采样到什么精度才能获得良好的声音?


1. 采样频率和信号频率的关系

 
如果您没有听过上一篇文章的音频,可以先回顾第一篇听听看,接下来的部分与此有关。 通过对比试听,我们可以很明显感觉到,随着采样率从8000Hz增加到44100Hz,我们越来越可以完整地听到整首歌曲的所有声音了,最明显的莫过于集中在高频段的镲片声,这个声音我们是几乎无法在8000Hz采样率下听到的。 


通过频谱图我们可以看到,8000Hz采样率下,我们完全无法获得高于4000Hz的音频信号:


8000Hz采样率下的声音,4kHz以上的频率已经完全消失


而在44100Hz采样率下,音频的频率范围可以扩展到22050Hz。


44100Hz采样率下的声音,频率可以延伸到超过22kHz 


相比之下,更高的采样率可以获得更多的高频率信息! 


8000Hz采样率下的声音,听起来就像是打电话听到的彩铃一样。事实上也是这样的,因为电话的音频编码使用的采样率就是8000Hz。 


44100Hz则是CD的规范的采样频率,能达到这个采样频率是音频可以称为“无损”的基本条件之一。 


看到这里,细心的你一定发现了一个关系——8000Hz采样率下最高可以听到4000Hz的频率,44100Hz采样率下最高可以听到22050Hz的频率。这似乎意味着,如果要记录频率为F的信号,采样频率就必须达到F的2倍,即F_sampling = 2*F_signal。 


恭喜你发现了信息行业中最重要的理论之一。可惜的是,发现这个规律的我们,已经没办法用这个发现来叱咤通信领域了。因为这个定理早在1928年就已经被美国的电信工程师H.Nyquist提出——这就是奈奎斯特采样定理


奈奎斯特


2. 2倍采样,就够了吗?

 
采样定理是可以用数学的方法严格证明的。但是这明显会影响了我文章的可读性,因此我用不太严谨的说法解释一下,为什么要有2倍以上的采样频率。 


如图所示一个正弦波,我们要记录它的大小和位置,最少应该采样几次呢?


一个普普通通的正弦波 


正弦波是周期的信号。图片中的正弦波y = sin(2πt)周期是1。我们只需要知道一个周期内,波形有多高、左右偏移了多少,就可以管中窥豹了。那么,一个周期内需要采样多少个点才能确定一个波形呢?假设我们在正弦波的波峰和波谷各采样一个点:


对正弦波每个周期采样2个点

看起来,好像这样就可以定位出一个波形的特征了,看起来奈奎斯特诚不我欺!


但是如果看看这个例子: 


对于同样的一串数值为0的采样点,可能有很多种还原的情况


可以看出,如果采样的时候,采样率刚好达到声音频率的2倍,是不能确保还原对应频率的波形的。接下来,我使用Audition的波形生成器来验证一下采样定理。 


对于44100采样率的信号,我生成一个22050Hz的正弦波波形,同时初相位保持为0°,如图所示:


使用Audition CC2018生成22050Hz的正弦波设置


得到的结果却是: 


啥也没有……


如果初相位调整为一个不是0°的值,比如40°,则可以看到对应的波形: 



但是在这个临界频率下,不是所有情况都可以被还原的。不过,当我们把生成的正弦波频率设置为22049Hz看看:


22049Hz的正弦波可以在AU中正常生成,只是减少了1Hz的目标频率,相当于采样率44100Hz>2×22049Hz,就可以完美采样到唯一的波形。 


事实上,数学上已经严格证明了,采样率只要比2倍更大,不论大多少,哪怕是2.0000000001倍,都可以还原出这个频率的原始波形。 所以…… 


3. 我们要用到什么样的采样率呢?

 
最简单的想法就是:人的耳朵能听到的范围内都采集下来,就好了! 


是的,基于这个思路,再结合一下我们初中物理课就讲过的“人的听觉范围大约在20~20000Hz之间”,因此,只要采样率能够超过20000Hz的两倍,就可以完整地记录到覆盖到人耳的听力范围的频率了。换句话说,对于人类来说,听一个声音,使用这样的采样率就已经足够了。 


当然,狗狗们可能就是例外。狗可以听到50kHz的声音(数据来源于Wikipedia),这意味着狗界的无损音频要达到100kHz以上的采样率。我们的无损CD在狗狗们的耳朵里,应该还是略显沉闷的。


听着糙,不过瘾


至于众所周知的CD的采样率标准44100Hz,这其实是一个历史遗留问题。这个数字是因为标准设计的时候的随意性导致的,但也不妨碍它能够满足采样定理的要求。另外,现在同样流行的48000Hz、96000Hz甚至192kHz、384kHz等采样率,根据采样定理,它们的覆盖频率早已远远超过人耳听觉的范围,那它们存在的意义是什么呢?


埋个伏笔,这个可以另开一篇文章讲讲。 


总而言之,当你的音乐可以达到40000Hz以上的采样率,就不会产生人耳范围内的频率丢失。按照现今的大环境,你使用44100Hz和48000Hz都是可以的。



本文作者:艾夫

音乐制作人、编曲人、混音师、艾楽音乐工作室主理人、华中科技大学光电信息专业硕士。

*欢迎原创投稿,详情请联系本号后台;

*文中观点为作者独立观点,不完全代表本号立场,仅供参考交流学习;

*本文部分配图源自网络,不用于商业用途;如有侵权,请联系本号处理。


“采”到多深好?浅析奈奎斯特采样定理的评论 (共 条)

分享到微博请遵守国家法律