【百科】只为寻觅真实的声音！浅谈无损音乐和有损音乐

2022-03-15 14:30:48

1875次

导读：其实，所谓无损实际上是不存在的。但声音的采样精度越高，声音质量也就越高。对于一般人来说，无损音乐和有损压缩过的音乐单靠耳朵是听不出其中区别的，但是用好的音响或者耳机播放出来的时候，就可以听出来。

随着数码时代的来临，数字信号比模拟信号优越已成为共识。但是，作为数字音乐文件格式的标准，WAV格式容量过大，使用起来很不方便。因此，一般情况下我们需要把它进行压缩为MP3、WMA、FLAC等格式。同时，网上流媒体音乐的盛行，也让音频压缩面临更多的挑战。

那么，怎么样去辨别什么是无损音乐，什么是有损压缩过的音乐呢？这两者之间又有什么区别呢？那就让“影音新生活”先从声音的采集为大家讲起……

声音的采集

声音信息以数字的方式存放在计算机及其相关设备里，而自然界的声音信息则是模拟信号。

计算机里的数字信号是通过“采样”、“量化”得来的，这里引用一个的奈奎斯特采样定理：当采样频率不低于声音信号的高频率的两倍时，采样得到的数字音频就能高保真地记录和还原原来的模拟声音，当然“高保真”也是相对而言的。一般人耳能感受到的音频信号频率范围大约在20Hz－20KHz之间，根据采样理论，如果采样频率大于40KHz，那么数字化后得到的数字音频就可以高保真的记录模拟音频。

数字音频的组成

通过了解声音的采集过程，我们知道数字音频是由采样频率、采样精度、声音通道数三个部分组成的，其中：

采样频率：既采样率，指记录声音时每秒的采样个数，它用赫兹(Hz)来表示。

采样精度：指记录声音的动态范围，它以位(Bit)为单位。

声音通道：既声道数（1-8个）。

通俗点说，我们可以把声波看成是一条曲线，我们知道，曲线是由点组成的，采样率就是每秒长度（上图横轴）中点的个数。而采样精度就是动态范围（上图竖轴）中点的个数。这两个维度的定位越细，声音的真实还原度就越高，音质也就会更好，当然，音频文件也就会越大。SONY新发布的音频格式Hi-Res Audio就是192kHz/24bit，6通道录制的音频文件，无损格式的大小一般会在200多兆。

采样率根据使用类型不同大概有以下几种：

8khz：电话等使用，对于记录人声已经足够使用。

22.05khz：广播使用频率。

44.1khz：音频CD。

48khz：DVD、数字电视中使用。

96khz-192khz：DVD-Audio、蓝光高清等使用。

采样精度常用范围为8bit-32bit，而CD中一般都使用16bit。

音频的压缩

了解到声音的采集和数字音频的组成之后，还不足以让我们明白无损音乐和有损音乐的差别。这时，我们还需要了解音频文件的压缩方式。目前我们常用的音频格式，大部分都是基于音频CD（采样率44.1khz、采样精度16bit，2通道）的原始文件“WAV”文件而来的。原始收录的声音数据保存在一个数组里面，这个数组就是PCM格式，而WAV格式，则是微软公司开发的一种编码格式，它的作用是将PCM格式的数据通过编码播放出来。

由于WAV内的数据基本上完整的还原了PCM数据，而其他的无损、MP3、AAC等其他编码格式基本也都是基于WAV文件再压缩而成。所以，我们可以简单的认为，WAV是原始音频格式，其他音频格式是压缩格式。

说到压缩，就离不开存储和传输，压缩的目的就是为了更好的存储和传输，所以在说压缩之前，需要我们对计算机的基本单位有一些了解。

我们都知道，计算机是二进制数制，计算机存储的文件都是由0和1两个数字组成。所以，计算机的传输就以每一个数字为单位，每一个数字称为1“位(bit)”，比如说，一段音频，他的基础数据是“0,1,1,1,0,1,1,0”，而传输的时候，就是将这些数字一个个的传输过去。上面说的采样精度就是这个单位。而计算机的存储单位是“字节(Byte)”，在计算机中，1个字节由8个位组成，也就是说8b(bit)=1B(Byte)。在计算机语言中，数据存储是以10进制表示，数据传输是以2进制表示，所以1KB=1024B=1024×8b。这也是造成我们看到的硬盘容量跟实际容量不符的部分原因。

返回来再说音频压缩。音频的比特率是指每秒传送的比特(bit)数，单位为bps(Bit Per Second)，比特率越高，传送数据速度越快。声音中的比特率是指将数字声音由模拟格式转化成数字格式的采样率，采样率越高，还原后的音质就越好。但比特率本身并不对文件的质量有直接影响，例如我们把128kb的文件作为源文件，即使转换成320kb的文件，其音质依然不会比128kb好。视频中的比特率（码率）原理与声音中的相同，都是指由模拟信号转换为数字信号的采样率。

CBR和VBR

我们在压缩MP3的时候经常会看到CBR、VBR两种方式。其中CBR就是Constants Bit Rate，恒定比特率；VBR就是Variable Bit Rate，动态比特率。传统的CBR约定死了MP3的采样率为固定值，一首MP3从头至尾为某固定值如128KBit/s进行压缩。而VBR则采取了一种全新的，全程动态调节技术的压缩方法。

当在低音段时，VBR会自动采用较低的比特率如32KBit/s对音质进行压缩；当在高音段时会用较高的比特率如224KBit/s对音质进行压缩；当在级高端时则采用高320KBit/s进行压缩。VBR这种在控制文件大小的情况下，大限度的提高了MP3的音质。

有损格式和无损格式

我们再来说有损格式和无损格式。简单来说，有损压缩就是通过删除一些已有数据中不太重要的数据来达到压缩目的；无损压缩就是通过优化排列方式来达到压缩目的。大概可以这样去看：有损压缩就像我们在一篇文章中删除一些不重要的助词，达到目的，解压缩后，已删除的内容无法恢复；而无损则是通过排版方式达到的，解压缩之后，还能获得完整的WAV数据，就像是我们常用的winzip和WinRAR那样。

在无损格式中，目前比较常用的有APE(Monkey's audio)、FLAC(Free Lossless Audio Codec)两种。前者拥有更小的比特率，后者则更容易传播，其区别就是，FLAC可以在传播中断后，已传播的数据就可以直接使用。比如我们下载一首APE格式的音乐，必须等全部数据下载完成后，才能播放；而FLAC则不同，你只下载了1/3，就能先播放这1/3的内容。

WAV文件也是一种编码格式，标准WAV文件的比特率是1411kb，而无损压缩则根据源文件的内容不同，大概是900-1000左右。

有损压缩的特性

上文我们说到，有损音频相较于无损音频来说，损失了一部分信息。那么，损失了什么信息？为什么要损失这部分信息呢？这就还需要我们了解有损压缩当中的特性。

音频有损压缩的原理基本上都是利用人耳听觉的心理声学特性（频谱掩蔽特性和时间掩蔽特性等）以及人耳对信号幅度、频率、时间的有限分辨能力，编码时凡是人耳感觉不到的频率不编码、不传送，即凡是对人耳辨别声音信号的强度、声调、方位没有贡献的部分（称为不相关部分或无关部分）都不编码和传送。对感觉不到的部分进行编码时，允许有较大的量化失真、并使其处于听阈（即人耳所能听到的音量）以下，人耳仍然感觉不到。所以任何有损格式，码率当然都是越高越好，码率高，不仅波形失真小，而且频率的衰减也小。

对于一般人来说，无损音乐和有损压缩过的音乐单靠耳朵是听不出其中区别的，但是用好的音响或者耳机播放出来的时候，就可以听出来。而作为音乐爱好者，他们对聆听音乐，往往不仅追求生理上的听觉享受，而且对音乐本身的完整性也有非常高的要求，故而一般均选择无损格式的音乐和的播放设备。