音频编码格式

音频编码格式是指要在计算机内播放或是处理音频文件,是对声音文件进行数、模转换的过程。

  • PCM编码
    PCM 脉冲编码调制是Pulse Code Modulation的缩写。是目前计算机应用中最高保真水平的音频编码格式。PCM音频数据是未经压缩的音频采样数据裸流,它是由模拟信号经过采样、量化、编码转换成的标准的数字音频数据。PCM约定俗成了无损编码,能做到最大程度的无限接近绝对保真。被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用,优点是音质好,缺点是体积大。

  • WAV格式
    WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,在声音文件质量和CD相差无几。WAV打开工具是WINDOWS的媒体播放器。尽管音质出色,但在压缩后的文件体积过大!相对其他音频格式而言是一个缺点。WAV是最接近无损的音乐格式,所以文件大小相对也比较大。

    WAV特点
    WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。WAV格式的主要缺点是需要音频存储空间。对于小的存储限制或小带宽应用而言,这可能是一个重要的问题。常见的WAV文件使用PCM无压缩编码,这使WAV文件的质量极高,体积也出奇大。适用于:多媒体开发、保存音乐和音效素材。

  • MP3编码
    MPEG-1 or MPEG-2 Audio Layer III是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3,是目前最流行的音频编码格式。1993年由德国Fraunhofer IIS研究院和汤姆生公司合作发展成功。

    MP3文件是由帧(frame)构成的,帧是MP3文件最小的组成单位。MPEG音频文件是MPEG1标准中的声音部分,也叫MPEG音频层,它根据压缩质量和编码复杂程度划分为三层,即 Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3这三种声音文件,并根据不同的用途,使用不同层次的编码。MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1和MP2的压缩率分别为4:1和6:1-8:1,而MP3的压缩率则高达10:1-12:1,也就是说,一分钟CD音质的音乐,未经压缩需要10MB的存储空间,而经过MP3压缩编码后只有1MB左右。不过MP3对音频信号采用的是有损压缩方式,为了降低声音失真度,MP3采取了“感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。根据MPEG规范的说法,MPEG-4中的AAC(Advanced audio coding)将是MP3格式的下一代。

  • AAC编码
    AAC是高级音频编码(Advanced Audio Coding)的缩写,出现于1997年,最初是基于MPEG-2的音频编码技术。由Fraunhofer IIS、Dolby Laboratories、AT&T、Sony等公司共同开发,目的是取代MP3格式。2000年,MPEG-4标准出台,AAC重新集成了其它技术(PS,SBR),为区别于传统的MPEG-2 AAC,故含有SBR或PS特性的AAC又称为MPEG-4 AAC。

    AAC是新一代的音频有损压缩技术,它通过一些附加的编码技术(比如PS,SBR等),衍生出了LC-AAC,HE-AAC,HE-AACv2三种主要的编码,LC-AAC就是比较传统的AAC,相对而言,主要用于中高码率(>=80Kbps),HE-AAC(相当于AAC+SBR)主要用于中低码率(<=80Kbps),而新近推出的HE-AACv2(相当于AAC+SBR+PS)主要用于低码率(<=48Kbps),事实上大部分编码器设成<=48Kbps自动启用PS技术,而>48Kbps就不加PS,就相当于普通的HE-AAC。

    AAC扩展名

  1. AAC—使用MPEG-2 Audio Transport Stream( ADTS,参见MPEG-2 )容器,区别于使用MPEG-4容器的MP4/M4A格式,属于传统的AAC编码(FAAC默认的封装,但FAAC亦可输出 MPEG-4 封装的AAC)
  2. MP4—使用了MPEG-4 Part 14的简化版即3GPP Media Release 6 Basic (3gp6,参见3GP ) 进行封装的AAC编码(Nero AAC 编码器仅能输出MPEG-4封装的AAC);
  3. M4A – 为了区别纯音频MP4文件和包含视频的MP4文件而由苹果(Apple)公司使用的扩展名,Apple iTunes 对纯音频MP4文件采用了”.M4A”命名。M4A的本质和音频MP4相同,故音频MP4文件亦可直接更改扩展名为M4A。

AAC特点
4. AAC是一种高压缩比的音频压缩算法,但它的压缩比要远超过较老的音频压缩算法,如AC-3、MP3等。并且其质量可以同未压缩的CD音质相媲美。
5. 同其他类似的音频编码算法一样,AAC也是采用了变换编码算法,但AAC使用了分辨率更高的滤波器组,因此它可以达到更高的压缩比。
6. AAC使用了临时噪声重整、后向自适应线性预测、联合立体声技术和量化哈夫曼编码等技术,这些技术的使用都使压缩比得到进一步的提高。(压缩比通常为18:1)
7. AAC支持更多种采样率和比特率、支持1个到48个音轨、支持多达15个低频音轨、具有多种语言的兼容能力、还有多达15个内嵌数据流。
8. AAC支持更宽的声音频率范围,最高可达到96kHz,最低可达8KHz,远宽于MP3的16KHz-48kHz的范围。
9. 不同于MP3及WMA,AAC几乎不损失声音频率中的甚高、甚低频率成分,并且比WMA在频谱结构上更接近于原始音频,因而声音的保真度更好。
10. AAC采用优化的算法达到了更高的解码效率,解码时只需较少的处理能力。
11. 不足:属于有损压缩,与APE、FLAC等无损格式相比,音质有“本质上”差距,同时USB3.0和大容量存储空间等技术的普及,AAC的优势不明显。

  • WMA(Windows Media Audio)
    是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质。一般使用Windows Media Audio编码格式的文件以WMA作为扩展名,一些使用Windows Media Audio编码格式编码其所有内容的纯音频ASF文件也使用WMA作为扩展名。WMA支持防复制功能,她支持通过Windows Media Rights Manager 加入保护,可以限制播放时间和播放次数甚至于播放的机器等等。WMA支持流技术,即一边读一边播放,因此WMA可以很轻松的实现在线广播。

    WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18,生成的文件大小只有相应MP3文件的一半。
      所需频宽:320~112kbps(压缩10~12倍)
      特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。
      优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。
      缺点:当Bitrate大于128K时,WMA音质损失过大。WMA标准不开放,由微软掌握。
      应用领域:voip

  • RA格式

    RA就是RealAudio格式,大部分音乐网站的在线试听都是采用了RealAudio,这种格式完全针对的就是网络上的媒体市场,支持非常丰富的功能。最大的闪烁点就是这种格式可以根据听众的带宽来控制自己的码率,在保证流畅的前提下尽可能提高音质。RA可以支持多种音频编码,包括ATRAC3。和WMA一样,RA不但都支持边读边放,也同样支持使用特殊协议来隐匿文件的真实网络地址,从而实现只在线播放而不提供下载的欣赏方式。RA和WMA是目前互联网上,用于在线试听最多的音频媒体格式。

  • AMR(Adaptive Multi-Rate)
    AMR:自适应多速率音频压缩音频编码格式,是一个使语音编码最优化的专利,专用于有效地压缩语音频率。

    AMR音频主要用于移动设备的音频压缩,压缩比非常高,但是音质比较差,主要用于语音类的音频压缩,不适合对音质要求较高的音乐类音频的压缩。AMR被标准语音编码 3GPP在1998年10月选用,现在广泛在GSM和UMTS中使用。

  • OGG
    OGG是一个自由且开放标准的容器格式,由Xiph.Org 基金会所维护,“Ogg”意指一种文件格式,可以纳入各式各样自由和开放源代码的编解码器,包含音效、视频、文字(像字幕)与元数据的处理。

    一般说到OGG,都是指Ogg_Vorbis,这就是常见的.ogg结尾的音频文件,Vorbis是一种有损音讯压缩格式,由Xiph.Org基金会所领导并开放源代码。Vorbis通常以Ogg作为容器格式,所以常合称为Ogg Vorbis。其实,OGG不仅仅只能包含Vorbis格式,它可以包含视频格式。因此,为了区分只包含音频格式的文件格式,产生了一种新的文件格式OGV,这种格式既包含音频格式,也包含视频格式。但是OGV文件格式的压缩方法和OGG是一样的,可以采用同一种方式进行解析。

    优点与缺点:
    优点:

    1. Ogg Vorbis的音质和MP3不相上下,但无法和FLAC比。
    2. Ogg Vorbis支持类似于MP3的ID3信息;
    3. Ogg Vorbis格式支持流式播放;
    4. Ogg Vorbis避免了像MP3文件的ID3标记那样烦琐的操作(有很多针对MP3的ID3修改软件标记早已不繁琐)。

    缺点:

    1. 播放兼容性差。mp3已经成了便携随身听的代名词。绝大多数播放器、包括手机、pad等设备都支持mp3格式(其实mp3专利芯片授权费极低),而支持ogg格式的播放器很少。

    2. mp3是1997年以前就已经诞生,将近20年垄断了消费机市场。ogg音频普及性非常差,相对于mp3而言音质也没有竞争力,普及的可能性极低。
      相对于已经普及的微软WMA格式,ogg没有任何优势。不管是播放软件兼容性,码率,流媒体等方面。

    3. 多声道系统已经由DOLBY、DTS两家公司垄断,他们都有完整的制作发行体系。大型多声道电影、电视、音乐制作都是基于这两家公司的技术和标准。ogg只能望洋兴叹了。

    4. 很多专业音频制作软件不支持ogg文件格式。

    5. 现今HIFI已经被HIRES(高解析)代替,随着存储、网速等限制,用户的聆听设备已经上了一个台阶,有损格式已经渐渐失去市场。

格式特点适用于
PCM编码的WAV音质非常好,被大量软件所支持多媒体开发、保存音乐和音效素材
MP3音质好,压缩比比较高,被大量软件和硬件支持,应用广泛适合用于比较高要求的音乐欣赏
OGG可以用比mp3更小的码率实现比mp3更好的音质,高中低码率下均具有良好的表现用更小的存储空间获得更好的音质(相对MP3)
WMA低码率下的音质表现难有对手在线试听、低要求下的音乐欣赏
    原文作者:甜芒芒
    原文地址: https://blog.csdn.net/fantian_/article/details/106561155
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞