MP3常用音频格式详细解说

MP3播放器

3人已加入

描述

MP3常用音频格式详细解说

一.技术原理
1.音频格式
  数字化音频格式的出现,是为了满足复制、存储、传输的需求。简单的说,早期的模拟音频格式,存在着复制失真和因为介质磨损而失效的问题。从CD盘的存储开始,数字格式音频文件开始普及,但又产生了一个问题——存储体积上的限制,同时CD盘仍然存在磨损的现象,如果保存到硬盘上(相对存储时间更长),在当时存储介质(主要是硬盘)仍然昂贵的情况下,也不是好的解决方法。而互联网的出现,更产生了远距离传输文件的要求,在带宽的制约下,缩小文件体积的需求变得更加强烈,这些都从外部因素上导致了有损压缩数字音频格式产生!

  而从内部因素来说,随着电脑运算、编码能力的提高、各种声学心理模式的进步,促进了各种有损压缩数字音频格式的层出不穷。如果光从历史及现在曾经涌现出的编码格式来看,应该会列举出很多,而在MP3机上使用的音频格式,我们向大家介绍的主要有如下几种——MP3(CBR、VBR、ABR)、WMA、ADPCM。

(1)MP3(CBR、VBR、ABR)
  MP3应该算目前使用用户最多的有损压缩数字音频格式了。它的全称是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3,1993年由德国夫朗和费研究院和法国汤姆生公司合作发展成功。

  刚出现时它的编码技术并不完善,它更像一个编码标准框架,留待人们去完善。早期的MP3编码采用的的是固定编码率的方式(CBR ),我们常看到的128KBPS,就是代表它是以128KBPS固定数据速率编码——你可以提高这个编码率,最高可以到320KBPS,音质会更好,自然,文件的体积会相应增大。

  因为MP3的编码方式是开放的,你可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理,所以,很快由Xing公司推出可变编码率的压缩方式(VBR)。它的原理就是利用将一首歌的复杂部分用高 bitrate 编码,简单部分用低 bitrate 编码,通过这种方式,进一步取得质量和体积的统一。当然,早期的Xing 编码器的 VBR 算法很差,音质与 CBR (固定码率)相去甚远。但是,这种算法指明了一种方向,其他开发者纷纷推出自己的VBR算法,使得效果一直在改进。目前公认比较好的首推 LAME,它完美地实现了 VBR 算法,而且它是是完全免费的软件,并且由爱好者组成的开发团队一直在不断的发展完善。

  而在VBR的基础上,LAME更加发展出ABR算法。ABR(Average Bitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。

(2)WMA
   WMA是Windows Media Audio的缩写,是微软力推的数字音乐格式。微软官方宣布的资料中称WMA格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相当的版权保护能力。

   应该说,WMA的推出,就是针对MP3没有版权限制的缺点而来——普通用户可能很欢迎这种格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的WMA则照顾到了这些唱片公司的需求,可以预见,唱片业可能将全力支持WMA标准。

  除了版权保护外,WMA还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当然,只在MP3低于192KBPS码率的情况下有效,实际上当采用LAME算法压缩MP3格式时,高于192KBPS时普遍的反映是MP3的音质要好于WMA)。

  不管怎么说,微软想介入的领域,它总能凭着自己的强大实力和在软件上的垄断地位,获得它想要的东西(尽管技术上它并不总是最出色)——这场战争应该是微软在数码音频格式领域的另一个IE与Netscape的战争版本。

  小结:因为本文的目的是针对MP3机上使用的数码音频格式而撰写的,所以,在播放格式上我只介绍目前MP3上常用的两种格式:MP3与WMA。如果从数码音频格式的角度来说,除了提到的这两个格式外,还有很多其他的格式:RA、MIDI、VQF、ATRAC、ATRAC3、Vorbis、AIF/AIFF、MP3PRO、Ogg、Dolby®Pro Logic®、Dolby Digital 5.1、Qdesign QDX、ATRAC3、VoiceAge等等。

  其实随着电脑运算能力的增强、声学原理认识的进步、压缩技术的发展,还会涌现出更多的数字压缩音频格式——相比前面提到的MP3、WMA,它们或者从压缩比上下工夫、或者从版权保护上下工夫(有正反的取舍,有的要,有的不要)、或者从音质上下工夫。

  但是,请注意:格式的技术先进并不代表市场!

  一种格式的流行,乃至成为一种使用数量上的标准,除了技术因素外,还取决于其他的因素。就我个人的看法,先入为主的影响是很大的,以MP3来说,正因为目前它在用户规模上是最大的,所以尽管它的压缩比、音质、版权保护方面都存在缺点,但是用户很容易形成一种惯性——获得MP3文件越容易,越多用户加入这个行列;反过来促进越多文件采用这种格式存储——这就形成了一个正向循环,加上因为更多的播放软件支持MP3、更多的第三方开发更先进的编码算法,这些都推动MP3在自身格式上的进步,又导致用户使用上的更加普及(正如我上面提到的那么多种格式,读者不说曾经使用过或了解,有些格式的名称大家是否听过都是疑问)。
所以,短期内我个人还是看好MP3格式的发展——除了上面提到的非技术因素外,随着存储介质容量和网络带宽的进一步增大,压缩比或许正变得不那么重要了(我现在敢大胆的使用高于192KBPS码率压缩自己的CD,遇到经典的,我甚至直接使用320KBPS,原因无它,我的电脑硬盘是40G,而这个配置还在逐渐落伍);版权保护也是双刃剑,对厂商而言是好事,对用户则是排斥的心理。

  因此,在本章节的最后,我并不做MP3、WMA格式与其他格式的对比,仅以这两个目前在MP3机上使用最频繁的格式来做一番对比。

  从压缩比角度来说,在低于192KBPS的条件下,WMA可以在同样音质条件下获得比MP3文件更小的体积——甚至一半。
所以如果你的MP3容量并不大,而且你并不追求音质的更完美(特别当你的用途是听一些英语教材、相声、评书类不要求音质、回放效果的时候),假如你的MP3机支持WMA格式的播放,那么恭喜你——你的MP3机容量可以变相的增大一倍。
反过来,如果你的MP3容量有够大(目前的主流应该是往128M发展),而且又注重音质感受,那么强烈建议你使用LAME压缩算法平均192KBPS以上码率压缩,你会发现,和你往常使用的128KBPS码率文件相比,会获得不同的感受(当然,还和MP3机的音质处理效果、耳机的选择相关)。

  这些是从我个人使用中获得的感受,你可以参考。但是更重要的是自己去尝试——因为MP3机正越来越往多档次方向发展——高、中、低端的MP3日趋细分:质量、功能、价格上都如是,只有配合自己的具体机型,通过实践,才能找到适合自己的格式及编码率。

(3)ADPCM格式
这个格式常用在MP3机的录音方面。我们常看到某款具有录音功能的MP3机在参数介绍上会标注“支持MP3,WMA,ADPCM格式”。
它其实也是一种编码格式,但针对的是文件体积的更小——自然音质上就没有什么优秀可言了。比如作为采访时的录音,32M的闪存,用这种格式录制,可以存储大约2个小时的录音。从音质和文件大小的统一性来说,应该是目前一个好的解决方案。
除了外录(采访、课堂录音)外,还有的MP3机使用这种格式进行对CD、磁带机的直接录制。可想而知,这样的源文件你还是以英语读物、相声类的为主,如果你想要录制音乐类的,劝你还是放弃,这种格式录制出来的效果用来听音乐只能用惨不能睹来形容。
小结:录音格式上,目前除了继续采用ADPCM格式外,越来越多的MP3机开始支持直接用MP3、WMA编码(特别在直接录制上)。但是这里要提出的一点是,MP3机的DSP在运算能力上比起电脑的CPU配合专门的编码软件还是差距太大,所以目前的产品里,我个人是不推荐用这种机器来直接录制音乐类文件,但相信随着集成电路的不断发展,这个功能会不断进步,最终将出现满足要求的直接录制产品——正如电脑上的部件发展一样,软件和硬件的互相促进、互相融合,终将带来合乎要求的产品。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分