重生90年:听劝后,鹰酱麻了 MP3技术简介

从本章开始听

MP3是一种音频压缩技术,它的全称是:MovingPictureExpertsGroupAudioLayerIII,简称MP3。它的目的是大幅度减少音频数据的数量。使用MPEG音频层3技术,可以把音乐压缩到1:10,甚至1:12,压缩成一个更小的文件。它于1991年由德国埃尔朗根的一群工程师们发明并使之标准化。MP3格式的音乐,被称为MP3音乐,而MP3播放器,则被称为MP3播放器。

MP3利用人耳对高频声信号不敏感的特点,将时域波形信号转换为频域信号,对不同频带采用不同的压缩率,对高频信号采用高压缩比或低压缩比以确保信号不失真。这就相当于放弃了人耳无法听到的高频声,只保留了低频部分,将声音压缩到了1∶10,甚至是1∶12。因为全名为MPEGAudio播放机3,所以大家都把它叫做MP3。

按照MPEG规范,AAC(高级音频编码)将成为下一代MP3格式。

最高参数MP3(320Kbps)的音质与CD、FLAC、APE等无损压缩格式相差不大。

1、MPEG-1音频层2编码由德国航天中心EagonMeier-Engelen主持,该项目由德国德国德国德施尔施特-卢夫特-德劳姆法赫(后称德国航天中心)主持。该计划由欧盟资助,其名称通常为EU-147。在1987至1994年间,EU-147进行了研究。

2、1991年,Musicam(即层2)和自适应频谱感知熵编码(ASPEC)两种方案已被提出。Musicam(Musicam)是由荷兰飞利浦(PhilipsPhilips)、法国CCETT(法国)以及德国Rundfunktechnik研究所提出的,其特点是结构简单,出错时鲁棒性强,且在高质量压缩时计算量小。基于子带编码的Musicam格式是决定MPEG音频压缩格式(采样速率,帧结构,头部,每帧采样点数)的重要指标。这一技术及其设计思想已经被定义为ISOMPEG音频层I,II,以及随后的MP3层3。在汉诺佛大学的赞助下,标准的制订工作由里昂·范·克尔克霍夫(一层)和格哈德·斯托尔(层二)完成。

3、由荷兰LeonVandeKerkhof,德国GerhardStoll,法国Yves-Fran?oisDehery,德国卡尔海茨·布兰登伯格组成的团队,吸收了Musicam和ASPEC的设计理念,并加入了自己的设计理念,研制出一种MP3,其速度可达128kbit/s,达到MP2192kbit/s的音质。

4、1992年,所有这些算法都被纳入MPEG第一标准组MPEG-1中,并产生了ISO/IEC11172-3国际标准,该标准于1993年发布。对MPEG音频的进一步研究最终成为1994年制定的第二个MPEG标准组MPEG-2标准的一部分,其官方名称为ISO/IEC13818-3,第一次发布于1995年。

5、由于压缩率取决于比特数目(en:bitdepth)以及输入信号的取样速率,所以编码器的压缩效率一般由比特速度来定义。但是,通常使用CD参数(44.1KHz,两个信道,每个信道16比特,或被称作2x16比特)作为压缩率基准,使用该基准的压缩率一般更高,这也显示出在有损压缩中压缩率存在的问题。

6、卡尔·伯恩伯格用苏珊娜·维加的歌《汤姆》作为CD媒介,对MP3压缩算法进行了评估。之所以选用这首歌曲,是因为歌曲中柔和的,简单的旋律,可以让你在重放的时候听得更清楚。有人戏称苏珊娜维加为“MP3之母”。在EBUV3/SQAM参考光盘中,专业音频工程师们会使用一些严肃的、关键性的音频片段来评估MPEG音频格式的主观音质。

向大众传播

为了产生符合位元的MPEGAudio文件(层1.层2.层3),一种被称为ISO11172-5的参考模拟软件,由ISOMPEG音频委员会的成员以C语言编制。它可以在某些非实时操作系统上演示第一个基于DSP的实时硬件解码器。一些其他MPEGAudio也被实时地开发出来,用在消费者接收器和机顶盒上(广播DAB和TVDVB)上。

随后,第一款名为l3enc的MP3编码器于1994年7月7日由Fraunhofer-Gesellschaft公司发行。

Fraunhofer开发小组于1995年7月14日选择了.mp3扩展名(之前的扩展名为.bit)。很多人都可以用他们自己的电脑来编写和播放mp3。因为那时的硬盘还很小(比如500MB),所以这一技术就成了存储电脑娱乐音乐的关键。

随着互联网上出现了MP2(MPEG-1AudioLayer2)文件,通常是用XingMPEG音频播放器播放的,之后又有TobiasBading为Unix开发的MAPlay。1994年2月22日,MAPlay首次推出,并已将其移植至微软视窗平台。

最初,只有一款MP2编码器产品是一种CD抓取器,它可以把CD音轨转换为WAV格式。

IUMA(IUMA)是互联网上首家高保真音乐网站,在MP3及互联网尚未普及前,已拥有数千首MP2唱片。

从1995年上半年一直到90年代末,MP3在互联网上迅速崛起。MP3之所以受欢迎,很大程度上是因为微软1997年推出了Winamp,1999年纳普斯特推出了Napster。这些程式让一般的使用者可以轻松的播放,制作,分享及收藏MP3档案。

近几年来,围绕着MP3文件进行点对点技术分享的辩论愈演愈烈,主要原因在于压缩可以实现文件共享,而未压缩文件又太大,难以分享。随着MP3文件在互联网上的广泛传播,一些大的唱片公司为了保护他们的版权而起诉了纳普斯特。

像iTunesMusicStore这样的商业在线音乐分发服务,一般都会采用其他或私有的数字版权管理(DRM)来对数字音乐的使用进行控制和限制。支持DRM的格式是用来保护版权不受侵犯的,但大部分的保护机制也可以通过几种方式被破解。电脑高手可以使用这些方法来产生可自由拷贝的解锁文件。唯一值得注意的是,微软的视窗媒体音频10格式尚未被破解。如果你想得到一个压缩的音频文件,那么你就必须压缩这些音频流,

由于MP3是一种有损压缩格式,所以它提供了各种不同的“比特率”选择,即表示每秒音频需要编码的数据位数。典型速度为128/Kbps至320Kbps(千位/秒)。相比之下,CD上未压缩的音频位速率为1411.2kbps(16bit/采样点×44100采样点×2声道)。

以较低比特率进行编码的MP3文件播放品质一般都不佳。如果使用太低的位元,「压缩噪音」(原录中并不存在的声音),则会在播放时显示出来。一个很好的例子就是压缩噪音:压缩声音;由于编码过程具有随机性和突变性,编码时产生的误差会更加明显,听上去就像是回音。

不同于编码文件的比特率;MP3格式的好坏,还取决于编码器的品质和编码信号的难易程度。对于普通信号,用优质编码器编码,有些人认为128Kbit/s的MP3,CD采样44.1KHz,在压缩速率约为11:1的情况下,其音质与CD音质相当。以此比率进行正确编码的MP3,其音质只能比调频广播好,主要受到频宽限制、信噪比等因素的限制。不过,听音测试表明,只要稍加练习,听者就能可靠地分辨出128Kbit/s的MP3和原CD之间的差异。很多时候,他们都觉得MP3的音质不能让人接受,但对于其他听众来说(比如在喧闹的汽车里或派对上)来说,音质还是可以接受的。很明显,对于低端声卡或扬声器来说,MP3编码的缺点并不明显,但当高品质的立体声系统与电脑相连时,特别是使用高保真音响装置或高品质耳机时,这种缺点更为明显。

为了进行比较,FhG(FhG)在其官网上发布了MPEG-1层1/2/3的压缩速率和数据率:

层1:384千比特/秒,压缩比:4:1

层2:192-25千位/秒,压缩比:8:1-6:1

层3:112-128千位/秒,压缩比:12:1-10:1

由于采用不同的心理声学模式,各层次间存在差异;层1的算法非常简单,因此编码需要较高的比特率。但是,这种完整的比较是非常困难的,因为不同的编码器使用的模型不同。

同时MP3算法建立了人类听觉整体特征模型,使其不能被人耳识别(如噪声干扰)。

好的编码器能达到128-160千比特/秒的音质,160-192千比特/秒的音质。因此,如果不在某一编码器或最佳编码器的主题中谈论128Kbit/s或192Kbit/s的声音质量,就会产生误解。一个好的编码器可以以128千位/秒的速度产生MP3,其音质可能会优于质量较差的编码器。此外,即使同一编码器、相同文件大小,相同比特率下的MP3,其音质也可能不如可变比特率的MP3好。

有一点值得注意,那就是音频信号的品质是一种主观的判断。安慰效应是非常严重的。很多用户不能通过A/B测试,也不能在较低位速率下区分文件。某一位速率对某些用户而言足够,而对其他用户而言则不够用。每个人对声音的感受是不一样的,因此,很难找到一种能让每个人都满意的心理声学模型。如果只是改变了诸如音频播放系统或环境之类的试听环境,可能会出现由有损压缩造成的音质下降。上面给出的数据对大部分人来说只是一个粗略的参考,但在有损压缩领域,测试压缩过程质量的有效方法是试听结果。

如果您的目标是实现无质量损失的音频文件或音频文件,则应采用无损压缩算法,该算法可将16比特PCM音频数据压缩至38%而不失音质,如LA,索尼ATRAC高级Lossless,DolbyTrueHD,DTS主LosslessAudio,MLP,索尼真实感音频,WavPack,苹果Lossless,TTA,FLAC,WMA,WMA,APE,等等。

对于需要进行编辑和混合处理的音频文件,要尽可能采用无损格式,否则有损压缩产生的错误可能在处理后不可预知,多个编码带来的损失会混杂在一起,经过处理后再编码,这些损失就更明显了。无损压缩可以获得最佳效果,但代价是降低压缩率。

一些简单的编辑操作,例如截取一段音频片段,就可以直接对MP3数据进行操作,无需重新编码。对于这些操作,可以不考虑上述问题,条件是使用适当的软件。

1998年9月,FraunhoferInstitute向数位MP3软件开发商发出信函,声明“发行或出售编码或解码器需要经过许可。”该信件声称未经许可的产品侵犯了弗劳恩霍夫和汤逊公司的专利权。如果你使用了MPEGLayer-3标准或者我们的专利,那么你就必须向我们申请授权。”

这些专利问题大大减缓了MP3软件的非授权发展,并把注意力转移到了研发上,转而关注其它替代品,比如WMA和OgVorbis。微软,一个视窗开发系统的制造商,专为MP3提供他们自己的视窗媒体格式,以避免专利授权的问题。在这些关键专利失效前,未授权编码器和播放器将会被视为非法的软件专利。

尽管有这些专利限制,永久MP3格式仍在不断改进;这一现象的原因似乎是由于以下因素产生的网络效应:

熟悉此格式,但不知是否还有其他可选择的格式。

这些可选择的格式并不能完全超越MP3,

许多MP3格式的音乐,

许多不同的软硬件都采用了这种格式,

由于不存在DRM保护技术,所以MP3文件能够轻松地被修改,拷贝,并在网络上重新分发,

大多数家用使用者并不了解或不关心软体专利之争,而且他们的争论往往是为了个人使用MP3格式。

此外,专利所有人都不愿意加大对开放源码解码器的授权收费,导致大量的免费MP3解码器出现。而且,虽然他们试图阻止发布编码程序的二进制代码,汤姆逊已经宣布,个人用户可以免费使用MP3编码器,而不必为此付费。虽然专利费是很多公司在使用MP3格式时要考虑的一个因素,但这对用户没有任何影响。

SisvelS.P.A及其美国子公司AudioMPEG公司此前曾起诉汤姆森侵权,但这些纠纷最终于2005年11月结束,该公司将其授权给汤姆森公司,后者也与AudioMPEG公司签订了一项授权协议。因为汤姆森和西斯科都有各自独立的专利,而MP3的合法地位并不明确。

Fraunhofer的专利已于2010年4月过期。

十一看书天天乐!充100赠500VIP点券! 立即抢充(活动时间:10月1日到10月7日)

飞卢小说网 hk.runhomo.com 欢迎广大书友光临阅读,创新、原创、火热的连载作品尽在飞卢小说网!

按左右键翻页

最新读者(粉丝)打赏

全部

飞卢小说网声明

为营造健康的网络环境,飞卢坚决抵制淫秽色情,涉黑(暴力、血腥)等违反国家规定的小说在网站上传播,如发现违规作品,请向本站投诉。

本网站为网友写作提供上传空间存储平台,请上传有合法版权的作品,如发现本站有侵犯权利人版权内容的,请向本站投诉。

投诉邮箱:feiying@faloo.com 一经核实,本站将立即删除相关作品并对上传人作封号处理。

关于我们| 小说帮助| 申请小说推荐| Vip签约| Vip充值| 申请作家| 作家福利| 撰写小说| 联系我们| 加入我们| 飞卢小说手机版| 广告招商

AllRights Reserved版权所有 北京创阅科技有限公司 ICP证京B2-20194099 京ICP备18030338号-3 京公安网备11011202002397号 京网文〔2022〕3848-114号

飞卢小说网(hk.runhomo.com) 中华人民共和国出版物经营许可证(京零通190302号)

RSS 热门小说榜
小说页面生成时间2024/10/25 2:20:24
章节标题
00:00
00:00
< 上一章
下一章 >