【翻译总结】模拟乐器音色的几个参数

本文翻译总结自网站链接如下,有很多细节删减,如有需要请自行前往查看。
https://www.audiolabs-erlangen.de/resources/MIR/FMP/C1/C1S3_Timbre.html
首先我在前面总结一下:
音色的影响因素很多,目前可建模的主要是波形的包络线、波形的快速振幅变化(颤音)、主频率和各高次频率的持续时间。
基本定义
除了音高、响度和持续时间之外,声音还有另一个基本方面,称为音色或音色。音色允许听众区分小提琴、双簧管或小号的音调,即使这些音调以相同的音高和相同的响度演奏。音色方面是很难掌握和主观的。例如,乐器的声音可以用明亮、黑暗、温暖、刺耳等词来描述。研究人员试图通过观察与更客观的声音特征的相关性来研究音色,例如时间和频谱演变、音调和类噪声成分的存在或缺失,或者音调的能量分布。
包络和 ADSR 模型
影响声音音色的一种声音特性是波形的包络,可以将其视为勾勒出其振幅极值的平滑曲线。在声音合成中,要生成的信号的包络通常由称为ADSR的模型描述,该模型由起音 (A)、衰减 (D)、延音 (S) 和释音 (R) 阶段组成。四个阶段的相对持续时间和振幅对合成音调的发声方式有重大影响。下图显示了一个理想化的 ADSR 模型,以及钢琴和小提琴声音的包络(演奏单个音符 C4)。

如图所示,演奏单个音符已经产生了复杂的混音,其特征可能会随时间不断变化,包含周期性和非周期性成分。在音乐音调的开始,通常会突然增加能量。在这个短暂的阶段,即音调的起音阶段,声音逐渐增强。它包含大量分布在整个频率范围内的非周期性成分。在声学中,这种出现在波形开始处的高振幅的类似噪声的短时声音也称为瞬变。在起音阶段之后,乐音的声音稳定下来(衰减阶段) 并达到具有(或多或少)周期性模式的稳定阶段。第三阶段,也称为维持阶段,构成了音乐音调的大部分持续时间,其中能量或多或少保持恒定或略有下降,就像钢琴声音的情况一样。在乐音的最后阶段,也称为释放阶段,乐音逐渐消失。
ADSR 模型是一种强大的简化,仅对某些仪器产生的音调的振幅包络产生有意义的近似值。例如,ADSR 模型不能很好地逼近如上所示的小提琴声音。首先,由于音调是轻柔的,音量逐渐增加,因此起音阶段在时间上得到了延展。此外,似乎没有任何衰减阶段,随后的维持阶段也不稳定;相反,幅度包络以规则的方式振荡。当小提琴手停止用弓拉动琴弦时,释放阶段开始。然后声音很快消失。

颤音和颤音
小提琴的例子表明了与音色相关的其他现象。例如,可以观察到振幅的周期性变化。这种幅度调制也称为颤音。颤音的效果通常与颤音一起出现,颤音是一种音乐效果,由频率的规则脉动变化(频率调制)组成。除了弦乐,颤音主要是人类歌手用来增加表现力的。尽管颤音和颤音只是强度和频率的局部变化,但它们不一定会引起整体音调的响度或音高的感知变化。相反,它们是影响音调音色的特征。

偏音(注:这段就是在说高次谐波)
也许表征音色的最重要和最广为人知的属性是某些分音的存在及其相对强度。直观地说,分音是音乐音调的主频率,最低分音是基频。不和谐度表示部分偏离最接近的理想谐波的程度。对于谐波声音,例如具有清晰可感知音高的乐音,大部分分音都接近于谐波。但是,并非所有分音都需要以相同的强度出现。下图显示了在不同乐器上演奏的单个音符 C4 的频谱图表示。

音符的基频 (261.6 Hz) 及其谐波(261.6 Hz 的整数倍)都显示为水平结构。乐音的衰减由每个分音中相应的衰减反映出来。音调的大部分能量包含在较低的分音中,而较高分音的能量往往较低。这种分布对于许多仪器来说是典型的。对于弦乐器,声音往往具有丰富的分音频谱,其中高次谐波中也可能包含大量能量。该图还揭示了颤音(特别是长笛)和颤音(特别是小提琴)。