关于“视频文件格式”的那些事儿
自1988年数字视频出现以来,每年都会开发新的视频格式,试图在质量、文件大小和视频回放方面提供改进。如今,伴随着视频的普及率呈指数式的快速增长,尤其伴随着智能手机和5G信号的广泛应用,观看数字视频几乎成为每个人的生活和工作常态。然而,对于大多数人来说,视频格式和工作原理仍然是一个令人困惑的问题。接下来我们将讨论视频文件的基础知识和应用。
在现实工作当中,相当一部分人通常会把文件的扩展名称为视频格式,但这是并不完全正确的。文件扩展名实际上是封装格式的另一种表达形式。当有人问一个视频是什么格式的时候,他们通常是想知道这个视频是用什么容器和编解码器来制作的,还想知道它存储在什么类型的介质上,并希望能找到可以播放它的设备。其实每个视频文件都有一个容器(封装格式)和一个编解码器。无论你做什么类型的视频制作,都能一个最优解来实现它。
换句话说,视频格式其实就是一种标准化的规则,规定了封装格式的编码方式、元数据甚至文件夹结构,它能够实现在不同设备和播放器上的兼容播放。当一个大平台决定在产品中支持某种格式的内容时,该视频格式就会变得流行起来,通常是因为技术上的突破或者特殊的应用场景,这通常会造成一个闭环的生态圈,其中创作者会以该格式生成内容,从而能够在大型平台播放;最后其他平台也不得不开始支持这种格式,因为大部分的视频内容用该格式生成。

关于容器:

容器(封装格式)会将视频流和音频流连同其他信息(元数据)一起保存在单个文件中;视频流告诉播放器屏幕上需要显示的内容;而音频流告诉播放器哪些声音需要与视频一起播放;元数据可以理解为是“关于数据的数据”,包含了关于视频的所有其它信息,包括比特率类型、分辨率、帧率、字幕、设备信息和创作时间等等。并且不同容器最终会以不同的文件扩展名的形式出现,如:.mov、.avi或.mp4等等。虽然有些容器只倾向于在特定的编解码器中保存媒体,例如用于MPEG文件的.mpg文件容器。但是有些容器,比如.mov,可以保存各种音频和视频编解码器中的数据。容器中有信息可以告诉你其中是否包含音频和视频数据,因此媒体播放器之类的东西会知道立即播放它们。

关于视频编解码器:

如果你处理过视频文件,你就会知道元数据中最重要的部分就是编解码方式。编解码器是一种用于编排音频或视频文件数据的顺序,其方式可用于回放、编辑或更改为其他编解码器(转码)。编解码器用于组织媒体数据,但这些数据保存在容器中。比如创建了一个编码后的视频流或音频流,使得它更小更容易管理之后,播放器会根据编码设置的规则对其进行编码定义。而在此过程中对原始视频的编码方式就有成百上千种。而这些不同类型的音频和视频编解码器,它们都有各自的优点。下面让我们来介绍一下最重要的编解码方式以及他们的优缺点吧。
1. H.264 & H.265视频编码

H.264(AVC)是目前最常用的视频编解码器,主要是因为对于相同的文件大小它提供的比特率比H.263要低得多,因此它得到了广泛的应用,使用H.264几乎不会遇到任何兼容问题。它的升级版H.265(HEVC)的压缩率几乎是H.264的2倍,这意味着用HEVC编码的文件,至少要比用AVC编码的文件小40%左右。这对2K以上的分辨率的视频流非常有利,但是另一方面HEVC的编码要复杂很多,需要预备3倍的资源来解码,也就意味着使用H.265需要后期配备高配置的电脑处理才行。值得说的是,H.265并不是开源的编解码,使用时要收取专利使用费。


2. Apple ProRes 视频编码

苹果公司的Apple ProRes 编解码器提供独一无二的多码流实时编辑性能、卓越图像质量和降低的存储率组合。Apple ProRes 编解码器充分利用多核处理,并具有快速、降低分辨率的解码模式。所有 Apple ProRes 编解码器都支持全分辨率的所有帧尺寸(包括 SD、HD、2K、4K 和 5K)。数据速率有所不同,具体取决于编解码器类型、图像内容、帧尺寸以及帧速率。尽管ProRes编解码器最初是为后期工作而设计的,并且它处理后的文件体积还是较大的;但由于编解码器在用户中的普及以及软件公司对编解码器的广泛支持,如今,它也被许多摄影机和摄像机制造商用作拍摄格式。

关于音频编码格式:

另一方面,音频编码方式同样重要。MP3是最著名的音频编码方式之一,1993年由MPEG开发这种有损音频编码方式,利用了人类听觉的局限性(通常被称为“听觉掩蔽现象”),比如MP3通常会被压缩到128KBPS只有CD文件大小的9%,但听起来有类似于CD的效果。20多年过去了,MP3仍然是分享和回放音频内容的主流格式,但它在视频方面的功能有限,从而使得一些其他的音频编码,在这些年里越来越流行,例如AAC是紧跟MP3之后开发的专用音频编码方式。AAC的主要优点是它得到了广泛的兼容,而且在相同的比特率下,你可以得到更好的效果,这也使得AAC成为当今最流行的音频编码方式。AAC几乎没有兼容问题,大多数情况下它适用于音频的最佳编码方式,但是AAC在多音轨方面有局限性的,这意味着我们需要一个新的编码方式来应对更强大的音频体验。如果您需要环绕声或与杜比产品兼容,可以选择AC-3。因为它拥有很好的多音轨支持功能,从而能够完全兼容环绕声音频,但除了DVD播放器和数字电视,AC-3几乎没有像AAC一样足够的设备支持和兼容。


当然,除了以上介绍的几种编解码器外,还有很多其他的音视频编解码器。本文也不在一一赘述,之后有机会再详细讲解。总而言之,通过上文对“视频格式”的简单讲解,我们需要了解到:编码格式五花八门,在实际应用过程中,我们要充分了解到市场主流编码格式的特点;根据制作的不同需求,考虑到不同编码的优劣,匹配到最好的格式组合,从而达到最佳的播放以及传播效果。