MPEG音頻編解碼器: 從mp3到xHE-AAC

2013-08-21 10:34 來源:電子信息網(wǎng) 作者:蒲公英

音頻編解碼器是現(xiàn)代媒體系統(tǒng)的基礎(chǔ)核心之一。沒有音頻編解碼器,就不會(huì)有現(xiàn)在的數(shù)字廣播、流媒體服務(wù)及音樂發(fā)行。首個(gè)同時(shí)也仍是最主流的MPEG音頻編解碼器是于1998年面市的mp3。此后,F(xiàn)raunhofer IIS和其他ISO-MPEG成員參與者開發(fā)并制定了多個(gè)音頻編解碼器。 每個(gè)MPEG音頻編解碼器已經(jīng)或?qū)?huì)改變我們消費(fèi)媒體的方式。本文介紹了MPEG音頻編解碼器及其應(yīng)用,并展現(xiàn)現(xiàn)代音頻編碼方案最成功的創(chuàng)建者Fraunhofer IIS。

MPEG L3: mp3

mp3徹底改變了音樂產(chǎn)業(yè),也改變了消費(fèi)者購買和享受音樂的方式。mp3目前仍然是音樂發(fā)行的主要格式,因?yàn)閙p3文件可以在任何設(shè)備上隨時(shí)隨地播放。mp3技術(shù)于上世紀(jì)80年代末開始開發(fā),1995年,隨著以 “.mp3”為后綴的文件的誕生,該技術(shù)達(dá)到了頂峰。同年,F(xiàn)raunhofer IIS推出了第一個(gè)mp3播放器的硬件原型。該文件后綴mp3很快成為 “MPEG Layer 3”標(biāo)準(zhǔn)名稱的替稱,但是直到三年后,即1998年,第一款mp3播放器才投放市場(chǎng)。

mp3是一種感知型音頻編解碼器,這類編解碼器基于人類聽覺系統(tǒng)的感知模型。這些模型描述了人耳能夠感知以及無法感知的音頻信號(hào)元素,無論聽眾的耳朵是否經(jīng)受過訓(xùn)練。通過分析音頻信號(hào),mp3和其他感知型音頻編解碼器確認(rèn)了以上事實(shí),即音質(zhì)各指標(biāo)可按人耳的感知優(yōu)先排序,并在最終音頻文件中精細(xì)的表現(xiàn)出來。因此,如果比特率(即至少192 kbps)選擇得當(dāng),聽眾則無法辨別mp3文件與源文件之間的差別。

不僅mp3基于感知模型,目前大部分的MPEG系列的音頻編解碼器也能夠明智的利用人類聽覺系統(tǒng),來降低數(shù)據(jù)速率和文件大小。AAC系列的音頻編解碼器也不例外。

AAC系列

AAC-LC

在市場(chǎng)大規(guī)模采用mp3之前,MPEG就已開發(fā)另一款音頻編解碼器。目的是在顯著降低數(shù)據(jù)速率的同時(shí)實(shí)現(xiàn)與mp3同樣高品質(zhì)的音頻質(zhì)量。自此,開啟了研發(fā)序幕,從1994年的AAC ,至2012年的擴(kuò)展型HE-AAC。整個(gè)編解碼器系列序幕。

1994年,根據(jù)MPEG-2格式制定了首款新型AAC編解碼器,命名為高級(jí)音頻編碼(Advanced Audio Coding,AAC)。根據(jù)mp3和其他編解碼器專利的開發(fā)經(jīng)驗(yàn),AT&T、Dolby、Fraunhofer IIS以及Sony等主要參與者從頭開始設(shè)計(jì)一款最先進(jìn)的新型音頻編解碼器。通過增加感知噪聲建模(Perceptual Noise Shaping,PNS)、頻帶復(fù)制(Spectral Band Replication,SBR),以及參數(shù)立體聲編碼(Parametric Stereo,PS)等工具,將MPEG-2 AAC編解碼器擴(kuò)展至MPEG-4標(biāo)準(zhǔn)。

基本的MPEG-4 AAC配置被稱為AAC-LC(低復(fù)雜性)的配置。它能提供“水晶般”的音頻質(zhì)量。在音頻編碼域中,“水晶般”音頻的編碼信號(hào)雖然在數(shù)學(xué)上與源文件有差異,但即便是擁有“金耳朵”的聽力專家也無法辨別其與源文件的區(qū)別。因此,AAC-LC可以滿足廣播公司最高的音頻質(zhì)量要求。立體聲AAC-LC比特率通常為128-192 kbps,5.1多聲道AAC-LC比特率為320 kbps,兩種AAC均以立聲道進(jìn)行編碼。AAC-LC是目前最靈活的音頻編解碼器之一,采樣率從8 kHz到192 kHz,每聲道的比特率高達(dá)256 kbps,并支持48聲道。該配置最著名的應(yīng)用就是Apple iTunes,并已用于日本ISDB數(shù)字電視標(biāo)準(zhǔn)。

1

圖1: MPEG AAC音頻編解碼器系列概覽

HE-AAC 和 HE-AACv2

MPEG-4“高效配置(High Efficiency Profile, HE-AAC)”結(jié)合了MPEG-4 AAC-LC和參量頻譜復(fù)制(Spectral Band Replication,SBR)工具,從而可以進(jìn)一步降低總比特率,同時(shí)保持出色的音頻質(zhì)量。當(dāng)立體聲信號(hào)的比特率低于128 kbps時(shí),HE-AAC與同音頻質(zhì)量的AAC-LC相比,比特率降低了30%。對(duì)于HE-AAC,低音頻頻譜使用AAC-LC進(jìn)行編碼,高頻譜通過SBR工具編碼。頻譜復(fù)制是一種參數(shù)方法,可使用該頻譜的高低重新創(chuàng)建該信號(hào)的整個(gè)音頻頻譜。為了進(jìn)一步降低比特率,AAC-LC編碼使用總信號(hào)50%的采樣進(jìn)行低頻率編碼。HE-AAC立體聲所用的典型數(shù)據(jù)速率為48-64kbps,HE-AAC 5.1多聲道的典型數(shù)據(jù)速率為160 kbps。同AAC-LC一樣,HE-AAC支持8至 192kHz的采樣率、高達(dá)48個(gè)聲道以及音頻特定的元數(shù)據(jù)。

2

圖2: HE-AAC編碼器解碼器工作原理

“高效AAC v2配置(HE-AACv2)”在HE-AAC基礎(chǔ)上添加了參數(shù)聲音(Parametric Sound,PS)工具。HE-AACv2 應(yīng)用參數(shù)進(jìn)行立體聲信號(hào)編碼,并進(jìn)一步降低了比特率。參數(shù)聲音編碼器不是發(fā)送兩個(gè)聲道,而是從立體聲信號(hào)中提取參數(shù),在解碼器側(cè)重建立體聲信號(hào),然后生成一個(gè)HE-AAC編碼的單聲道混音。參數(shù)數(shù)據(jù)與頻譜數(shù)據(jù)在AAC比特流的輔助數(shù)據(jù)字段中傳輸。解碼器解碼單聲道信號(hào),參數(shù)解碼器重建立體聲。對(duì)于立體聲來說,采用參數(shù)數(shù)據(jù)傳輸HE-AAC編碼的單聲道信號(hào)比傳輸雙聲道 、HE-AAC編碼信號(hào)的效率更高。對(duì)于立體聲信號(hào)來說,HE-AACv2典型比特率為24至32 kbps。

3

圖3: HE-AAC v2編碼器解碼器工作原理

目前,AAC和HE-AAC得到廣泛應(yīng)用。尤其是在互聯(lián)網(wǎng)應(yīng)用中, AAC和HE-AAC是mp3之外主要的音頻編解碼器。

HE-AACv2廣泛地應(yīng)用于最先進(jìn)的電視廣播系統(tǒng)。它是DVB工具箱的組成部分,還是最近推出了第二代地面電視指定的編解碼器,應(yīng)用在西班牙、英國、法國、愛爾蘭、瑞典、奧地利、意大利、丹麥、芬蘭和挪威等國家。在巴西和南美洲的大多數(shù)國家,HE-AAC是地面電視廣播的唯一指定音頻編解碼器。此外,HE-AAC也是智能電視中的一個(gè)指定部件。例如,它是歐洲混合廣播寬帶電視(Hybrid Broadcast Broadband TV,HbbTV)數(shù)據(jù)服務(wù)的指定編解碼器。因此,所有高清電視接收器設(shè)備,如目前歐洲和南美洲銷售的電視機(jī)和機(jī)頂盒,都支持HE-AAC。所有主要廣播編碼器廠商很早之前便將HE-AAC部署到他們的設(shè)備中。當(dāng)然,HE-AACv2支持所有相關(guān)的廣播元數(shù)據(jù)。

HE-AAC是主流音頻流媒體編解碼器。所有主要的流媒體平臺(tái)都支持HE-AAC,包括Flash、Silverlight、Windows Media Player、Winamp以及iTunes。Mac OS X和Windows等操作系統(tǒng)中都有HE-AAC, iOS、Android、Windows Phone、Symbian及BlackBerry等手機(jī)系統(tǒng)也是如此。

目前,蘋果HLS、微軟Smooth Streaming及Adobe Dynamic Streaming等成熟的http適配流媒體系統(tǒng)也基于AAC系列編解碼器。

HE-AACv2還是消費(fèi)電子領(lǐng)域內(nèi)流媒體標(biāo)準(zhǔn)的一個(gè)重要部分,在Open IPTV Forum、ATIS、HbbTV和DLNA等電子領(lǐng)域發(fā)揮著不可或缺的作用。因此,幾乎所有的數(shù)字電視、藍(lán)光播放器、機(jī)頂盒和游戲機(jī)都支持該編解碼器。HE-AACv2的廣泛支持使它成為內(nèi)容提供商選擇的最佳編解碼器。因此,Pandora、Aupeo、Hulu以及BBC iPlayer等大多數(shù)網(wǎng)絡(luò)廣播都基于HE-AACv2。

1 2 > 
音頻 MPEG

相關(guān)閱讀

暫無數(shù)據(jù)

一周熱門

  • 合翔電子X中之杰智能:揭秘一家離散制造企業(yè)的柔性智造秘訣!
    合翔(常州)電子有限公司成立于1996年,主要生產(chǎn)蜂鳴器并廣泛應(yīng)用于汽車、筆記本電腦、家用電器等領(lǐng)域。公司有BYD、奇瑞
  • AI 推動(dòng)未來科學(xué) 晶泰科技共襄未來科學(xué)大獎(jiǎng)周
    近日,為期五天的未來科學(xué)大獎(jiǎng)周在中國香港舉辦。未來科學(xué)大獎(jiǎng)周旨在弘揚(yáng)科學(xué)精神,禮贊科學(xué)成就,以前瞻視角引領(lǐng)公眾探尋世界科
  • Quobly宣布容錯(cuò)量子計(jì)算關(guān)鍵里程碑
    法國領(lǐng)先的量子計(jì)算初創(chuàng)公司Quobly報(bào)告稱,F(xiàn)D-SOI技術(shù)可以作為商業(yè)量子計(jì)算的可擴(kuò)展平臺(tái),充分利用傳統(tǒng)的半導(dǎo)體制造