欢迎光临散文网 会员登陆 & 注册

B站HI-RES的重编码到底有没有损失?如何只从音频码率判断B站HIRES视频真实音频数据量

2022-09-08 15:18 作者:DRV-STUDIO  | 我要投稿


大家好,首先非常感谢大家一如既往对我们的支持。

最近做了一些实验(也不能叫做实验,就算是B站的性能测试吧),其中有音频的,也有视频的。

视频部分呢,肯定B站大佬们的知识性和专业性都比我强得多的多,所以就不在这儿班门弄斧了,所得的视频实验数据也已经和工作组的其他小伙伴们交流过了。

本文章就着重聊聊B站的HIRES音频功能里,大家关注最多的两个问题,这两个问题是我在翻我视频的评论和私信,已经QQ粉丝群里基本上是讨论最多的几个问题之一了。


再次强调(自保),本人非以音频编辑制作为生计的从业者,所论述的观点也可能不是很对,请大家理性讨论,欢迎大家友善交流并指出不当之处,但是如果你是来找茬抬杠的,那我就不客气的拉黑你了,因为毕竟中国人还是太多了不是吗?

首先,先讨论一下朋友们关心的最大的问题:B站HIRES音频的重新编码到底会不会有损原音质??

这个问题是有省时助手的:B站转码后的HIRES音频对比原上传音频文件完全无损失。


先抛出结论可能就会有人抬杠:怎么可能?B站都会对视频二压后有损画质,难道音频就不会?

这种抬杠我只能说是呵呵。这就纯属缺席审判加有罪推论了,根本就是靠想象去研究问题……


昨天我们上传了4个测试用的视频。

我们用某种方式把这四个视频的HIRES音轨给缓存了出来。文件是M4S格式的,用MKVTOOLNIX查看显示里边封装了FLAC音轨。

于是我们将其中的FLAC音轨拆解了出来,然后将该音轨无损转换成WAV文件(与我们上传视频时封装在视频中的音轨格式相同)。

之后我们进行了对比:

其中文件大小是一个字节都不差,说明持续时间可以精确到微秒级的一致了。你可能会说:「因为WAV的关系,文件长度一样,但是内容不一样,它文件大小也是一样的。」那好继续往下看。


我们对这四组文件进行了AU的「振幅统计」分析:

「频率分析」:

以及波形图和频谱图的对比:

其中所有数据都是一模一样的。我们观察了波形图和频谱图,也是一模一样。所以我们就可以认定,B站编码后的HIRES FLAC在音频数据信息上是完全一致的。

至于B站的HIRES编码,我认为这是一个高压缩率的FLAC编码,这个在我之前的文章也有说过:

实际情况是:对于FLAC这种编码,无论他再怎么高压缩,它能还原出来的音频信息是不会有损失的。为什么B站用了这么高压缩率的模式,那答案肯定就是因为网络带宽成本和服务器空间成本,这些都是要钱的。所以B站使用一个尽量高的压缩也是十分合理的,因为这个高压缩并没有影响音质。

2022/9/15更新

经我们进一步测试,证实了B站的HIRES音频流完全和上传之前视频里封装的音频完全相同:

我们用特殊手段得到了B站的音频流,有的以.m4s封装,有的则以.m4a封装,但是数据流编码均为FLAC编码。其中B站的音频流文件与我们封装的音频文件的「音频MD5」完全相同。

(有关MD5是什么东西请百度)

下图左侧是封装的原FLAC格式音频,右侧为B站HIRES音频流文件。

可以看出,封装格式不同,但是编码都是FLAC,只是B站的编码器压缩率更高,我们的压缩率为level6,经测试B站的压缩率比FLAC1.2的编码器的最高压缩率level8还要高。

但是无论压缩率怎样高,这些都是毫不影响音质的。

所以,有人评论说B站会「二压音质」就纯属无稽之谈了。目前现在B站的所有APP,包括计算机应用、网页版和移动设备,都不能绕开SRC。这个我觉得也不是完全应该B站背锅,操作系统的设计也占到一定的责任,毕竟在音频数据层面B站是没有打任何折扣的。如果你可以调整系统的SRC,那么损失可以说是微乎其微,对于大多数人来说SRC和原音频采样率一致(或SRC高于B站音频采样率96kHz/24bit)的话,是很难分辨出来的差距和区别的(可能你不是那大多数人),如果您对此感到怀疑的话,可以自行盲听测试或分析音频文件。


如果说,话都说到这儿了,有些人还是要骂B站垃圾、HIRES功能是噱头的话,那没准我也可以理解为是他们无能,毕竟他们没有能力去改SRC,也不能给B站提供一个更好的独占方案,而只能「无能狂怒」似的骂骂B站而已。



下面是本文的第二部分


有些朋友与我交流说:「UP,你的视频都有标注详细的采样率、位深度,甚至最后还会贴出频谱图。但是现在HIRES的视频越来越多,他们并没有详细标注,有些音频码率也很小还标注了96k/24bit,这个应该怎么区分呢?」

就这个问题,其实我也不能给予一个完全准确的答案,原因还是看我这篇文章关于「音频文件就是个容器」这个比喻:

对于B站的HIRES音频的FLAC编码,我们可以使用如下小技巧来大概判断这是个什么级别的HIRES,因为B站会把所有音频统一用他们的压缩率和编码方式去重新编码,所以在音频码率可上以做到一个「同级别一致」(自己编的词,理解一下吧)。

首先明确一点,B站HIRES音频的最大采样速率是96kHz,位深度统一为24bit

以我们的4个测试视频为例:

如果这个音频是一个动态比较大的,比较激烈的JPOP的话,那么音频码率可以大概是这样的一个对应关系:

如果封装为96kHz/24bit(每声道的音频频谱最大可达48kHz)

实验1:若该音频最高频谱达48kHz的话,那么音频码率大致应为3000~3200kbps左右。

实验2:若该音频最高频谱达33kHz左右的话(上边1/3是没有数据),那么音频码率大致为应为2500~2700kbps左右。

实验3:若该音频最高频谱只有22k左右,例如48k/24bit或CD音频,把他们强行以改变采样率的方法封装成96/24的音频的话,那音频码率可能仅为2000~2300kbps。

如果该HIRES音频封装为48kHz/24bit(每声道的音频频谱最大可达24kHz)

实验4:若该音频的响度比较大,且频谱图已经如图所示全占满的话,音频码率可达1900kbps左右,基本上和上边的实验3类似。

如果CD音频用更改位深度的方法欺骗B站识别为HIRES音轨,使其不会被压缩,码率也可能仅有1400kpbs左右,不会很高。


请注意:以上实验均基于响度大,实际音频数据比较多的流行类歌曲进行试验。

若该音频为古典独奏:特别是钢琴小提琴独奏,音频码率基本上与上方实验3的音频码率相似。

若该音频不是一直像实验用歌曲那么动感,比如是抒情歌曲,或者副歌部分比较动感,前半部分比较抒情,那么码率上在上述实验数据上还要打一个9折(85%~90%)左右可能比较准。

以上就是本文的全部内容,基本上就是一个心得的交流和解答一下一些评论和私信中朋友们比较关心的问题。

如果再有什么其他问题,也欢迎您在本文评论区、本号每个视频下方的评论区,甚至是私信和QQ群与我们交流。


另外,欢迎您友善地提出意见和建议,但是不代表up会100%无条件接受和采纳您的意见和建议~我们在和您交流类似于这个问题时,肯定会阐述和维护我们现有的技术和观点,请不要觉得我们的反驳就是对您的不友善,谢谢大家。


最后重申一下,上述所有实验均为本人亲自试验,结果只能当作窍门、心得交流用途使用,不能代表任何官方的意见,请大家悉知。本人可保证所有数据真实有效,但是可能不能保证是完全准确和完全正确的。不当之处请友善讨论。


 


B站HI-RES的重编码到底有没有损失?如何只从音频码率判断B站HIRES视频真实音频数据量的评论 (共 条)

分享到微博请遵守国家法律