欢迎光临散文网 会员登陆 & 注册

UTAU笔记 - 音源采样率的分析

2022-04-03 17:21 作者:守护芙音  | 我要投稿

目前UTAU普遍使用的音源格式为:44100Hz,单声道,16位,wav格式。

为获得更好的采样效果,拟使用48kHz,立体声,32位,wav格式音频进行音源测试,观察不同格式下的音源会造成的变化。本次测试使用Moresampler引擎。

1. 位数测试

经过测试,得出以下结论

16位音频能够正常显示原音设定界面,双击P正常预览。填词音可正常播放。

24位音频波形变得杂乱,充满整个音轨,双击P预览为刺耳的杂音。填词音可正常播放。

32位音频波形变得杂乱,充满整个音轨,双击P预览没有声音。填词音可正常播放。

使用UTAU过程中发现原音设定是一大串杂乱的波形,那么就可以推测波形文件的位数不是16位。结论是仍然推荐使用16位wav音频

44.1kHz,单声道,32位 - 原音设定
44.1kHz,单声道,24位 - 原音设定
44.1kHz,单声道,16位 - 原音设定

2. 声道数测试

44.1kHz,立体声,16位 - 原音设定
44.1kHz,立体声,16位 - 输出音频
44.1kHz,单声道,16位 - 原音设定
44.1kHz,单声道,16位 - 输出音频

观察及对比波形可以发现,音源为立体声和单声道的情况下,两者原音设定波形和输出波形几乎完全一致

测试使用的立体声录制的时候左右声道信息相近,没有明显的空间信息。在空间信息更明显的情况下,波形应该有更大的差异,不过区别仍然非常小。由于UTAU输出为单声道波形,无法保留立体声信息,因此使用立体声音源意义不大

个人推测UTAU会对输入立体声进行重采样,使用某种混合模式,例如Auditon的左声道和右声道各50%混合的方式生成单声道的文件,本质上还是单声道输入。不过立体声音源仍然可以正常使用(部分up主配布的音源里面就使用了立体声wav波形)。

结论是仍然推荐使用单声道wav音频

3. 采样率测试


44.1kHz,单声道,16位 - 原音设定
48kHz,单声道,16位 - 原音设定
44.1kHz,单声道,16位 - 输出音频
48kHz,单声道,16位 - 输出音频

观察发现,48kHz和44.1kHz的原音设定波形完全一致,而输出波形出现了波形和音量的变化,其中44.1kHz输出音量比48kHz输出音量大了1.2dB左右。其余音频细节无法进行判断,从听感的角度出发,以及各大引擎的兼容性,还是推荐使用44.1kHz的采样率制作音源。但使用48kHz采样率也是可行的

4. 结语

本次测试针对的是Moresampler引擎,默认引擎以及其他引擎未进行测试,可能会出现不同的结果。本次测试可能存在不准确的地方,结论仅供参考。

UTAU笔记 - 音源采样率的分析的评论 (共 条)

分享到微博请遵守国家法律