UTAU笔记 - 音源采样率的分析

目前UTAU普遍使用的音源格式为:44100Hz,单声道,16位,wav格式。
为获得更好的采样效果,拟使用48kHz,立体声,32位,wav格式音频进行音源测试,观察不同格式下的音源会造成的变化。本次测试使用Moresampler引擎。
1. 位数测试
经过测试,得出以下结论
16位音频能够正常显示原音设定界面,双击P正常预览。填词音可正常播放。
24位音频波形变得杂乱,充满整个音轨,双击P预览为刺耳的杂音。填词音可正常播放。
32位音频波形变得杂乱,充满整个音轨,双击P预览没有声音。填词音可正常播放。
使用UTAU过程中发现原音设定是一大串杂乱的波形,那么就可以推测波形文件的位数不是16位。结论是仍然推荐使用16位wav音频。



2. 声道数测试




观察及对比波形可以发现,音源为立体声和单声道的情况下,两者原音设定波形和输出波形几乎完全一致。
测试使用的立体声录制的时候左右声道信息相近,没有明显的空间信息。在空间信息更明显的情况下,波形应该有更大的差异,不过区别仍然非常小。由于UTAU输出为单声道波形,无法保留立体声信息,因此使用立体声音源意义不大。
个人推测UTAU会对输入立体声进行重采样,使用某种混合模式,例如Auditon的左声道和右声道各50%混合的方式生成单声道的文件,本质上还是单声道输入。不过立体声音源仍然可以正常使用(部分up主配布的音源里面就使用了立体声wav波形)。
结论是仍然推荐使用单声道wav音频。
3. 采样率测试




观察发现,48kHz和44.1kHz的原音设定波形完全一致,而输出波形出现了波形和音量的变化,其中44.1kHz输出音量比48kHz输出音量大了1.2dB左右。其余音频细节无法进行判断,从听感的角度出发,以及各大引擎的兼容性,还是推荐使用44.1kHz的采样率制作音源。但使用48kHz采样率也是可行的。
4. 结语
本次测试针对的是Moresampler引擎,默认引擎以及其他引擎未进行测试,可能会出现不同的结果。本次测试可能存在不准确的地方,结论仅供参考。