資源描述:
《ATRAC體系壓縮原理介紹》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、ATRAC是一種數(shù)字音頻壓縮算法,其全稱是Adaptive?Transform?Acoustic?Coding——自適應(yīng)聲學(xué)編碼,它主要是基于聲學(xué)心理學(xué)(Psychoacoustics)原理,積極的利用人耳聽覺的特性,將信號(hào)中人耳感覺不到的不進(jìn)行編碼和傳送,從而實(shí)現(xiàn)減少數(shù)據(jù)傳輸率的目的。下面筆者將具體介紹ATRAC編碼和解碼的過程。??我們通常一提到數(shù)據(jù)壓縮方法,大家都會(huì)想到刪除冗余部分這種基本方法。例如,我們?cè)谝煌N音量頻率持續(xù)的音樂段中,假定用二進(jìn)制補(bǔ)碼表示的原始信號(hào)是11111……11共計(jì)64個(gè)1
2、,不壓縮的話,這段信號(hào)將會(huì)占用8個(gè)字節(jié),若用64*1來表示可能2個(gè)字節(jié)就夠了。假如我們?nèi)绻x音樂段內(nèi)所有取樣的值本身都是1,只有得0的部分才被記錄到存儲(chǔ)介質(zhì)中,那我們記錄這一音樂斷只需一個(gè)時(shí)間軸標(biāo)識(shí)即可,根本不占用空間。這就是刪除冗余的基本思路,由它壓縮過的數(shù)據(jù)可以完全被重建,是一種無(wú)損失的壓縮方法。但是現(xiàn)實(shí)中的音頻信號(hào)是很復(fù)雜的,如果真的采用這種方法進(jìn)行壓縮,其效率是很低的——只是根據(jù)音階無(wú)數(shù)次的重新定義并記錄基準(zhǔn)值就是一項(xiàng)浩瀚的工作了,而且能不能真正的節(jié)省存儲(chǔ)空間也是個(gè)問號(hào),因此使用這種方法是有限
3、制的。??數(shù)字音頻專家發(fā)現(xiàn),在原始信號(hào)和經(jīng)過壓縮——解壓縮過程處理的信號(hào)是允許有差別的,只要使人們不能輕易體察到這種差別同樣可以達(dá)到高保真的要求。換句話說,只要使處理后的信號(hào)(原來信號(hào)加上噪聲的)中噪聲部分的能量盡可能減小至不被聽到就是成功的編碼方法(噪聲指的是經(jīng)壓縮——解壓縮過程后的信號(hào)與原始信號(hào)的差別)。??但是經(jīng)過聲學(xué)心理學(xué)的仔細(xì)研究,發(fā)現(xiàn)噪聲被感知的能力并不是簡(jiǎn)單的數(shù)字能表示的。人們感覺到的噪聲大小會(huì)因噪聲的頻率及很多動(dòng)態(tài)因素而有很大的不同,改變某些加給噪聲的情況竟然也會(huì)使人耳對(duì)其與原來的差別感
4、覺不出來。在ATRAC中主要應(yīng)用聲學(xué)心理學(xué)的三個(gè)主要內(nèi)容來進(jìn)行數(shù)據(jù)壓縮的。??1.?去除處于聽閾以下的部分并根據(jù)等響度曲線優(yōu)化比特分配。聲音要達(dá)到一定的聲壓級(jí)才能被聽到,這一最小可聽聲壓級(jí)就被稱為聽閾,它表述了人們聽覺的絕對(duì)感覺。人的聽閾雖然有個(gè)體差異,但其統(tǒng)計(jì)值卻非常接近。聲強(qiáng)超過聽閾時(shí),隨聲強(qiáng)的增加主觀上產(chǎn)生由越來越響感覺。這里聲強(qiáng)是客觀刺激量,響度是聽覺的主觀心理量。聲音的頻率不同,人感受到的響度并不相同。通常以40dB的1000Hz純音作為基準(zhǔn),并將此時(shí)的響度定義為1sone(1sone對(duì)應(yīng)的響
5、度級(jí)為40phon),聲音的頻率不同它和基準(zhǔn)音等響的聲壓級(jí)也不同。比較不同純音和基準(zhǔn)音等響時(shí)的聲壓級(jí)隨頻率變化的曲線成為等響曲線(Equi-loudness?Curves),如圖1所示。??圖中虛線為聽閾,虛線以下為人依靠雙耳不能感知的聲音。從圖中可以看出人耳響度聽覺得一些特性:響度取決于聲強(qiáng),提高聲強(qiáng),響度等級(jí)相應(yīng)提高,但聲音的響度并不唯一決定于聲強(qiáng),還受頻率的影響。不同頻率的純音有不同的響度增長(zhǎng)率,在曲線的最小值點(diǎn)及其周圍的有限鄰域就是人耳最敏感的頻率范圍(4kHz左右),ATRAC對(duì)于這個(gè)范圍內(nèi)的
6、信號(hào)應(yīng)有較少的噪音,盡量保持原始信號(hào);不過對(duì)于不敏感的部分則可以容忍一定程度的失真。??2.?去除由于掩蔽效應(yīng)造成聽閾提高而無(wú)法被感知的信號(hào)。當(dāng)人們同時(shí)聽兩個(gè)聲音時(shí),其中一個(gè)聲音的感受會(huì)隨著另一個(gè)聲音的出現(xiàn)而改變。由于其它聲音的干擾造成該聲音聽閾上升的現(xiàn)象叫做掩蔽效應(yīng)(Masking)。掩蔽效應(yīng)與聽覺傳導(dǎo)系統(tǒng)(人耳機(jī)耳內(nèi)組織)無(wú)關(guān),純屬人類神經(jīng)系統(tǒng)判斷的結(jié)果。假定對(duì)聲音A的閾值已經(jīng)確定為50dB,但同時(shí)又聽到聲音B,人們發(fā)現(xiàn)由于聲音B的影響使A的聽閾提高到了64dB,即比原來的閾值提高了14dB才能被聽
7、到。這個(gè)例子中,B稱為掩蔽聲,A稱為被掩蔽聲,14dB被稱為掩蔽量。由一個(gè)純音引起的掩蔽大體上決定于它的強(qiáng)度和頻率,低頻聲能有效的掩蔽高頻聲,但高頻聲對(duì)低頻聲的掩蔽作用不大。通過窄帶噪聲進(jìn)行的掩蔽效應(yīng)試驗(yàn)結(jié)果表明,如圖2掩蔽量隨掩蔽聲的增強(qiáng)而加大,最大掩蔽量出現(xiàn)在掩蔽聲頻率附近。當(dāng)掩蔽聲和被掩蔽聲同時(shí)作用時(shí)掩蔽的效果最明顯,被稱為同時(shí)掩蔽。但掩蔽效應(yīng)可以發(fā)生在兩者不同時(shí)作用的條件下。掩蔽聲作用在前,被掩蔽聲作用在后的稱為前掩蔽,反之為后掩蔽,如圖3。被掩蔽聲在時(shí)間上越接近掩蔽聲,閾值提高越大。掩蔽聲和被
8、掩蔽聲在時(shí)間上相距很緊時(shí),后掩蔽作用大于前掩蔽。且掩蔽聲強(qiáng)度增加并不帶來掩蔽量的相應(yīng)增加,這與同時(shí)掩蔽效果不同。在這里有兩個(gè)重要的結(jié)論對(duì)ATRAC編碼中依靠掩蔽效應(yīng)建立聲學(xué)模型有著重要意義。強(qiáng)信號(hào)的頻率與弱信號(hào)相同或比它高時(shí),同時(shí)掩蔽最有效;強(qiáng)信號(hào)停止比較長(zhǎng)的時(shí)間里后掩蔽有效,但前掩蔽只在強(qiáng)信號(hào)開始之前的2~3ms內(nèi)有效。??3.?明確由臨界頻帶確定的頻帶噪聲對(duì)純音的掩蔽。當(dāng)頻帶噪聲的頻帶不太寬時(shí),掩蔽曲線更具對(duì)稱性,并且不受頻率的影響。只