欢迎光临散文网 会员登陆 & 注册

音频无损否?

2023-08-12 16:39 作者:橙子Rutaceae  | 我要投稿

很多时候我都会想知道自己下载的音乐到底是不是无损的,偶然间我看到了某某网站,如下

模拟源

模拟源音乐必须要经历模数转换,通过声卡等设备将模拟信号转换为电脑可以读取的数字信号。模拟媒介是通过介质本身的物理改变来存储音乐的。

例如:

  • 录音机通过改变磁带上的磁性强弱来记录声音。将录音走带装置接入录音设备,即可制作磁带的数字副本。

  • 唱片刻针在黑胶唱片上刻划出凹槽,以物理形式表现声音。通过前置放大器和声卡即可翻录黑胶唱片,制作其数字副本。

数字源

数字源音乐记录的是已经以电脑能够读取的格式编码好的信号,因此无需经过模数转换。数字媒介是存储了数字音乐文件(一串二进制数字)的物体。

例如:

  • CD

  • DVD

  • SACD(Super Audio CD)

  • WEB 商店下载(iTunes、Amazon、艺术家官网等)

请不要将下载所得的 WEB 资源和 WEB Rip 混淆起来。WEB Rip 指的是用音频流制作的有损(劣质)转码,这种音频流可能是 YouTube 或其他在线流服务。

数字音频资源可以通过 频谱分析 检查其是否为劣质转码。

模拟与数字之争

关于两者听起来是否不同仍存有许多争议。有些人喜欢黑胶的「感觉」,认为其听起来「温暖」而「饱满」。其他人则认为数字资源提供了纯净而原始的聆听体验。

音频格式

音频格式就是一类能够存储音乐的电脑文件。它分为无压缩、无损压缩、有损压缩三类。


比特率(Bitrates)

比特率 指的是单位时间传输或处理的比特数,单位是千比特每秒(kbps)。在比较不同比特率的文件时(对于同一首歌),更高的比特率一般意味着更优的质量。比如,一个 MP3 320kbps (CBR) 文件每秒传输 320 千比特。


无压缩(Uncompressed Lossless)

无压缩格式存储了原始录音的所有数据。即使静音部分也被一视同仁地赋予与有声部分完全相同的比特率。无压缩文件是很庞大的。主流的无压缩格式采用脉冲编码调制(PCM)。比如:

  • WAV (PCM)(用于 Windows)

  • AIFF (PCM)(用于 macOS)


无损压缩(Compressed Lossless)

无损压缩格式也存储了原始录音的所有数据,但由于压缩了数据,它所占用的空间比之无压缩格式要少。通过「剥夺」静音部分的比特率「份额」以及压缩有声部分占用的比特率,对于同一首歌,无损压缩文件通常是无压缩文件的一半大小。

由于无压缩和无损压缩格式都保留了原始录音的所有数据,因此它们是可以互相转换而没有任何损耗的。比如:

  • Free Lossless Audio Codec (FLAC)

  • Apple Lossless Audio Codec (ALAC)

  • Monkey's Audio (APE)


有损压缩(Lossy)

有损格式总是经过压缩的。有损格式的文件大小小于前两者,因为它抛弃了一部分原始数据。通常被抛弃的数据处于人类无法察觉的高频,但是,有损和无损格式之间是有可能存在明显的可听差异的。

由于有损格式在压缩过程中损失了数据(及质量),它就无法被无进一步损失地转码到无损格式或其他有损格式。比如:

  • MPEG Layer 3 Audio (MP3)

  • Advanced Audio Encoding (AAC)

  • Windows Media Audio (WMA)

  • Dolby Digital Audio Codec 3 (AC3)

  • DTS Coherent Acoustics Codec (DTS)

  • AC3 (通常来自 DVD)

  • DTS (通常来自 DVD)

文件大小(File Size)

下面是一个例子,展示了同一首歌在无压缩、无损压缩、有损压缩三种格式下得到的文件大小。示例是经典的流行歌曲, Avril Lavigne 的 Sk8er Boi,长 3 分 24 秒。

  • 无压缩 — WAV (PCM): 34.3 MB

  • 无损压缩 — FLAC: 25.75 MB (25% 被压缩)

  • 有损压缩 — MP3 320 (CBR): 7.78 MB (78% 被压缩)


透明性(Transparency)

透明性用以描述有损音频文件的可听质量。如果一个有损音频文件听起来和无损没差,即普通人不能区分两者,那么就可以认为该文件是透明的。对于大多数人来说,192 kbps 的 MP3 文件是透明的。

LAME

是一款编码器,它能够将任何输入的音频文件转换、压缩,输出为 MP3 文件。所得的 MP3 输出文件其比特率可以是恒定的、可变的,抑或是平均比特率。

恒定比特率(CBR)

在编码 CBR 文件时,你需要确认一个预设码率,而后编码器将这个码率贯穿输出文件始终。这意味着输出文件的每一秒都是等大的,不管所含有的声音内容复杂与否。CBR 文件的每一秒拥有相同的质量,由于静音部分和有声部分码率相同,在同等质量条件下 CBR 文件比之 VBR 和 ABR 文件都要来得大。同时,这种特性也意味着 CBR 文件的大小是可以预期的。


可变比特率(VBR)

在编码 VBR 文件时,你需要事先决定编码质量,而后编码器将通过改变码率来将这个质量贯穿输出文件始终。这意味着输出文件的每一秒其大小都取决于其复杂程度,可在 0 到 320 kbps(MP3 的天花板)之间变化。由于 VBR 文件的目标是恒定质量而非恒定比特率,其大小便难以精确预测,它主要取决于两点:预设质量和音频数据自身。预设质量越高、音频数据越多,VBR 结果文件就越大。当我们谈论一个 VBR 文件的码率时,实际上往往指的是它码率的平均值,即总大小除以总时长。

LAME 拥有从 V0 到 V9 的一系列 VBR 预设。V0 是质量最高的 VBR 预设,V9 最低。 V0通常其比特率最终会在 230 到 270 kbps 之间。V2 是通常其比特率最终会在 180 到 210 kbps 之间。


平均比特率(ABR)

在编码 ABR 文件时,你需要确认一个预设码率,而后编码器将允许码率发生变动,但是输出文件的码率平均值一定会是你预设的码率。这意味着 ABR 文件的大小像 CBR 一样可以预测,但是它每秒的码率又像 VBR 文件一样可以变动,取决于每一秒内音频数据的复杂程度。

由于它是 CBR 和 VBR 的结合体,因此它在两方面都做得不咋地,用俗话来说就是「门门通,样样松」。

转码

转码(动词)的意思是将文件从一种格式转换成另一种。转码(名词)可以指任何转码后的文件,但它通常含贬义,为了区分,我们会特别用「劣质转码」这个说法来指明。


正确转码(Good Transcodes)

正确转码的意思是,在转码过程中,文件全程都没有被转换成有损格式,或是仅仅在最后一步转换成有损格式。

正确转码示例:

  • 无压缩 → 无损压缩

  • 无压缩 → 有损压缩

  • 无损压缩 → 无压缩

  • 无损压缩 → 无损压缩

  • 无损压缩 → 有损压缩


劣质转码(Bad Transcodes)

劣质转码的意思是,在转码过程中,文件或是被不止一次地转换成有损格式,或是从有损格式转换到无损格式。

劣质转码示例:

  • 高比特率有损 → 低比特率有损

  • 有损 → 同比特率有损

  • 有损 → 无损

频谱分析

频谱分析是以可视的方式展现音频文件的数据。每个音调都有其特定的频率:低音频率低,高音频率高。所有的这些频率都会被展现在频谱图(简称「spectral」)上,其纵轴是频率,横轴是曲目时长。频率以赫兹(Hz)和千赫兹(kHz)为单位。人类的听力范围大约是从 20 Hz ~ 20 kHz。

由于频谱图展示了文件的所有数据,因而它是你判断音频是否劣质转码的好帮手。每个文件都有一个相对标准的截止频率。


CD/无损

零售 CD 中的歌曲以及无损歌曲,其频率应全程冲到 22 kHz。由于无损格式之间的转码保留了所有的数据,FLAC、WAV(PCM)、ALAC 等的频谱看起来应是完全相同的。

Spectral (FLAC)

不过,不同的流派的频谱看起来不尽相同。上例是一首流行歌曲,所以多数频率表现都很明亮。但古典钢琴曲的视觉表现:

Spectral (FLAC - Classical)

看起来差好多,是吧?但它仍然是无损的频谱!注意「白噪音」(紫光)仍然延伸到 22 kHz,即使它们没能派上用场。

MP3

不同类型的 MP3 其截断频率也不同。MP3 往往会在 16 kHz 的位置带有一个「限阈」(你可以在频谱中看到它)。

MP3 320kbps (CBR) 的频率截断在 20.5 kHz。

Spectral (MP3 320)

MP3 256kbps (CBR) 的频率截断在 20 kHz。

MP3 V0 的频率截断在 19.5 kHz。

Spectral (MP3 V0)

MP3 192kbps (CBR) 的频率截断在 19 kHz。

Spectral (MP3 192)

MP3 V2 的频率截断在 18.5 kHz。

Spectral (MP3 V2)

MP3 128kbps (CBR) 的频率截断在 16 kHz。

Spectral (MP3 128)

劣质转码

在尝试判别劣质转码时频谱是怎样发挥作用的?比方说你从一个博主处下载了一首 FLAC 格式的歌。鉴定它是真无损而非劣质转码文件的唯一办法就是查看它的频谱。(像 AudioIdentifier 这样的程序在检测劣质转码时并不可靠。)

举个例子,如下的频谱来自一个 FLAC 文件:文件扩展名是 .flac,大小 21.8 MB,且听起来没啥毛病。

Spectral (MP3 192 to FLAC)

但是……哇哦,它看起来像是正常的 FLAC 频谱应有的样子吗?显然不是嘛!这个文件是从 MP3 192kbps (CBR) 转码成 FLAC 的。它是有损到无损的转码,即劣质转码。

程序

对于频谱分析,我们推荐 Adobe Audition (Windows 或 macOS)、Audacity (Windows、macOS、Linux) 或 SoX (Windows、macOS、Linux — 仅命令行) 中的任意一者。以上示例中的频谱图是使用 Adobe Audition CS 6 制作的。

虽然说你应当使用频谱分析来判断一个文件是否劣质转码,但你首先需要采用另一类软件来查看文件的比特率或编码预设。要达到这个目的,我们推荐 Windows 用户使用 Audio Identifier 或 dbPowerAmp dnuos 或 MediaInfo。


非压缩

  • 线性脉冲编码调制(LPCM,通常仅称为PCM)是媒体文件中未压缩音频的格式,也是CD-DA的标准。请注意,在计算机中,LPCM通常存储在诸如WAV、AIFF或AU之类的容器格式中,或作为原始音频格式,尽管技术上不是必需的。

    • FFmpeg

  • 脉冲密度调制(PDM)

    • foobar2000 Super Audio CD解码器(基于MPEG-4 DST参考解码器)

    • FFmpeg(基于dsd2pcm)

    • Direct Stream Digital(DSD)是Super Audio CD的标准--是一项属于Sony和飞利浦的专利,利用脉冲密度调制(pulse-density modulation)编码将音频信号存储在数字媒体上的科技,这项技术的应用对象是SACD。以下是DSD音源文件的种类: 无压缩格式: 1. DSDIFF(Direct Stream Digital Interchange File Format): 主要用于业务领域的格式,扩展名为“dff”。 2. DSF(DSD Stream File): 索尼为了让PC能播放DSD而开发的格式,扩展名为“dsf”。 DSD主要以DSF文件形式销售。这是因为DSF原本就是为PC设计的格式,相较于DSDIFF,它在添加标签和管理方面更加容易且优越。 3. WSD(Wideband Single-bit Data): 由1比特音频联盟开发的格式,扩展名为“wsd”。 现在,能够播放WSD格式的应用程序大约只有AudioGate,基本上没有被使用。

  • 脉冲幅度调制(PAM)


无损压缩

积极使用中

最热门:

  • 自由无损音频编解码器(FLAC)

    • libFLAC

    • FFmpeg

  • Apple 无损音频编解码器(ALAC)

    • Apple QuickTime

    • libalac

    • FFmpeg

    • Apple Music

  • Monkey's Audio(APE)

    • Monkey's Audio SDK

    • FFmpeg(仅解码器)

  • OptimFROG(OFR)

  • Tom的无损音频压缩器(TAK)

    • TAK SDK

    • FFmpeg(仅解码器)

  • WavPack(WV)

    • libwavpack

    • FFmpeg

  • True Audio(TTA)

    • libtta

    • FFmpeg

  • Windows Media Audio无损(WMAL)

    • Windows Media 编码器

    • FFmpeg(仅解码器)

其他

  • DTS-HD主音频,又称为DTS++ 和 DCA XLL

    • libdca(仅解码器)

    • FFmpeg(仅解码器)

  • Dolby TrueHD - Blu-ray 上的DVD-Audio标准(基于MLP数学模型)

    • FFmpeg

  • 子午线无损打包(MLP),也称为Packed PCM(PPCM) - DVD中的DVD-Audio标准

    • FFmpeg

  • MPEG-4音频无损编码(MPEG-4 ALS)

    • SSC、DST、ALS和SLS参考软件(ISO/IEC 14496-5:2001/Amd.10:2007)

    • FFmpeg(仅解码)

  • MPEG-4可扩展无损编码(MPEG-4 SLS) - HD-AAC中使用的部分。

    • SSC、DST、ALS和SLS参考软件(ISO/IEC 14496-5:2001/Amd.10:2007)

  • RealAudio无损

    • RealPlayer

    • FFmpeg(仅解码)

  • BFDLAC(BFD无损音频压缩)。正在开发中。

    • FXpansion的BFD3鼓软件。(2013-2017)

特殊格式

  • ATRAC Advanced Lossless (AAL) - 极度不受欢迎

    • FFmpeg (仅有损解码器)

  • Direct Stream Transfer (DST) - 仅用于Direct Stream Digital

    • SSC、DST、ALS和SLS参考软件(ISO/IEC 14496-5:2001/Amd.10:2007)

    • FFmpeg(仅解码器)

  • Original Sound Quality (OSQ) - 仅用于WaveLab


停产

  • Lossless Audio(LA)[4] - 10年以上未更新

  • Shorten(SHN)[5] - 正式停产

    • libshn

    • FFmpeg(仅解码)

  • Lossless Predictive Audio Compression(LPAC) - MPEG-4 ALS的前身

  • Lossless Transform Audio Compression(LTAC) - LPAC的前身

  • MPEG-1音频第三层 HD(mp3HD) - 官方停产

  • RK音频(RKAU)[6] - 官方停产

不存在蓝牙无损。

这里推荐 foobar2000 的音频播放器软件。可以转换各种音频格式(如DST、DSF、DFF、APE等)到FLAC格式。你只需要安装相应的解码器组件,就能实现格式转换。 以下是你使用foobar2000将音频转换为FLAC格式的操作步骤:

  1. 首先,访问 foobar2000 官网 (https://www.foobar2000.org/) 并下载软件,然后进行安装。

  2. 打开 foobar2000,然后将你需要转换格式的音频文件添加到程序的播放列表中。这可以通过拖放或者通过主菜单选择“文件”>“添加文件”来实现。

  3. 选中需要转换的音频文件,然后右击选择“转换”>“...”,打开转换设置窗口。

  4. 从“输出格式”下拉菜单中,选择“FLAC”。你还可以配置其他参数,例如压缩级别。

  5. 设置输出文件夹,以便知道转换后的文件保存在哪里。 

  6. 确认设置无误后,点击“转换”按钮开始转换音频文件。

注意:在进行DST、DSF等格式的转换时,你可能需要安装相应的解码器组件。可以在 foobar2000 官网的Components页面 (https://www.foobar2000.org/components) 查找并下载相应的组件。安装组件后,重启 foobar2000,即可进行所需格式的转换。

不用梯子也可以就不放链接了

音频无损否?的评论 (共 条)

分享到微博请遵守国家法律