ATRAC體系壓縮原理介紹

ID：41107842

大?。?6.59 KB

頁(yè)數(shù)：6頁(yè)

時(shí)間：2019-08-16

資源描述：

《ATRAC體系壓縮原理介紹》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、ATRAC是一種數(shù)字音頻壓縮算法，其全稱是Adaptive?Transform?Acoustic?Coding——自適應(yīng)聲學(xué)編碼，它主要是基于聲學(xué)心理學(xué)（Psychoacoustics）原理，積極的利用人耳聽覺的特性，將信號(hào)中人耳感覺不到的不進(jìn)行編碼和傳送，從而實(shí)現(xiàn)減少數(shù)據(jù)傳輸率的目的。下面筆者將具體介紹ATRAC編碼和解碼的過程。??我們通常一提到數(shù)據(jù)壓縮方法，大家都會(huì)想到刪除冗余部分這種基本方法。例如，我們?cè)谝煌N音量頻率持續(xù)的音樂段中，假定用二進(jìn)制補(bǔ)碼表示的原始信號(hào)是11111……11共計(jì)64個(gè)1

2、，不壓縮的話，這段信號(hào)將會(huì)占用8個(gè)字節(jié)，若用64*1來表示可能2個(gè)字節(jié)就夠了。假如我們?nèi)绻x音樂段內(nèi)所有取樣的值本身都是1，只有得0的部分才被記錄到存儲(chǔ)介質(zhì)中，那我們記錄這一音樂斷只需一個(gè)時(shí)間軸標(biāo)識(shí)即可，根本不占用空間。這就是刪除冗余的基本思路，由它壓縮過的數(shù)據(jù)可以完全被重建，是一種無(wú)損失的壓縮方法。但是現(xiàn)實(shí)中的音頻信號(hào)是很復(fù)雜的，如果真的采用這種方法進(jìn)行壓縮，其效率是很低的——只是根據(jù)音階無(wú)數(shù)次的重新定義并記錄基準(zhǔn)值就是一項(xiàng)浩瀚的工作了，而且能不能真正的節(jié)省存儲(chǔ)空間也是個(gè)問號(hào)，因此使用這種方法是有限

3、制的。??數(shù)字音頻專家發(fā)現(xiàn)，在原始信號(hào)和經(jīng)過壓縮——解壓縮過程處理的信號(hào)是允許有差別的，只要使人們不能輕易體察到這種差別同樣可以達(dá)到高保真的要求。換句話說，只要使處理后的信號(hào)（原來信號(hào)加上噪聲的）中噪聲部分的能量盡可能減小至不被聽到就是成功的編碼方法（噪聲指的是經(jīng)壓縮——解壓縮過程后的信號(hào)與原始信號(hào)的差別）。??但是經(jīng)過聲學(xué)心理學(xué)的仔細(xì)研究，發(fā)現(xiàn)噪聲被感知的能力并不是簡(jiǎn)單的數(shù)字能表示的。人們感覺到的噪聲大小會(huì)因噪聲的頻率及很多動(dòng)態(tài)因素而有很大的不同，改變某些加給噪聲的情況竟然也會(huì)使人耳對(duì)其與原來的差別感

4、覺不出來。在ATRAC中主要應(yīng)用聲學(xué)心理學(xué)的三個(gè)主要內(nèi)容來進(jìn)行數(shù)據(jù)壓縮的。??1.?去除處于聽閾以下的部分并根據(jù)等響度曲線優(yōu)化比特分配。聲音要達(dá)到一定的聲壓級(jí)才能被聽到，這一最小可聽聲壓級(jí)就被稱為聽閾，它表述了人們聽覺的絕對(duì)感覺。人的聽閾雖然有個(gè)體差異，但其統(tǒng)計(jì)值卻非常接近。聲強(qiáng)超過聽閾時(shí)，隨聲強(qiáng)的增加主觀上產(chǎn)生由越來越響感覺。這里聲強(qiáng)是客觀刺激量，響度是聽覺的主觀心理量。聲音的頻率不同，人感受到的響度并不相同。通常以40dB的1000Hz純音作為基準(zhǔn)，并將此時(shí)的響度定義為1sone（1sone對(duì)應(yīng)的響

5、度級(jí)為40phon），聲音的頻率不同它和基準(zhǔn)音等響的聲壓級(jí)也不同。比較不同純音和基準(zhǔn)音等響時(shí)的聲壓級(jí)隨頻率變化的曲線成為等響曲線（Equi-loudness?Curves），如圖1所示。??圖中虛線為聽閾，虛線以下為人依靠雙耳不能感知的聲音。從圖中可以看出人耳響度聽覺得一些特性：響度取決于聲強(qiáng)，提高聲強(qiáng)，響度等級(jí)相應(yīng)提高，但聲音的響度并不唯一決定于聲強(qiáng)，還受頻率的影響。不同頻率的純音有不同的響度增長(zhǎng)率，在曲線的最小值點(diǎn)及其周圍的有限鄰域就是人耳最敏感的頻率范圍（4kHz左右），ATRAC對(duì)于這個(gè)范圍內(nèi)的

6、信號(hào)應(yīng)有較少的噪音，盡量保持原始信號(hào)；不過對(duì)于不敏感的部分則可以容忍一定程度的失真。??2.?去除由于掩蔽效應(yīng)造成聽閾提高而無(wú)法被感知的信號(hào)。當(dāng)人們同時(shí)聽兩個(gè)聲音時(shí)，其中一個(gè)聲音的感受會(huì)隨著另一個(gè)聲音的出現(xiàn)而改變。由于其它聲音的干擾造成該聲音聽閾上升的現(xiàn)象叫做掩蔽效應(yīng)（Masking）。掩蔽效應(yīng)與聽覺傳導(dǎo)系統(tǒng)（人耳機(jī)耳內(nèi)組織）無(wú)關(guān)，純屬人類神經(jīng)系統(tǒng)判斷的結(jié)果。假定對(duì)聲音A的閾值已經(jīng)確定為50dB，但同時(shí)又聽到聲音B，人們發(fā)現(xiàn)由于聲音B的影響使A的聽閾提高到了64dB，即比原來的閾值提高了14dB才能被聽

7、到。這個(gè)例子中，B稱為掩蔽聲，A稱為被掩蔽聲，14dB被稱為掩蔽量。由一個(gè)純音引起的掩蔽大體上決定于它的強(qiáng)度和頻率，低頻聲能有效的掩蔽高頻聲，但高頻聲對(duì)低頻聲的掩蔽作用不大。通過窄帶噪聲進(jìn)行的掩蔽效應(yīng)試驗(yàn)結(jié)果表明，如圖2掩蔽量隨掩蔽聲的增強(qiáng)而加大，最大掩蔽量出現(xiàn)在掩蔽聲頻率附近。當(dāng)掩蔽聲和被掩蔽聲同時(shí)作用時(shí)掩蔽的效果最明顯，被稱為同時(shí)掩蔽。但掩蔽效應(yīng)可以發(fā)生在兩者不同時(shí)作用的條件下。掩蔽聲作用在前，被掩蔽聲作用在后的稱為前掩蔽，反之為后掩蔽，如圖3。被掩蔽聲在時(shí)間上越接近掩蔽聲，閾值提高越大。掩蔽聲和被

8、掩蔽聲在時(shí)間上相距很緊時(shí)，后掩蔽作用大于前掩蔽。且掩蔽聲強(qiáng)度增加并不帶來掩蔽量的相應(yīng)增加，這與同時(shí)掩蔽效果不同。在這里有兩個(gè)重要的結(jié)論對(duì)ATRAC編碼中依靠掩蔽效應(yīng)建立聲學(xué)模型有著重要意義。強(qiáng)信號(hào)的頻率與弱信號(hào)相同或比它高時(shí)，同時(shí)掩蔽最有效；強(qiáng)信號(hào)停止比較長(zhǎng)的時(shí)間里后掩蔽有效，但前掩蔽只在強(qiáng)信號(hào)開始之前的2～3ms內(nèi)有效。??3.?明確由臨界頻帶確定的頻帶噪聲對(duì)純音的掩蔽。當(dāng)頻帶噪聲的頻帶不太寬時(shí)，掩蔽曲線更具對(duì)稱性，并且不受頻率的影響。只

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 6



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無(wú)此問題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

ATRAC體系壓縮原理介紹

ATRAC體系壓縮原理介紹

相關(guān)文章

相關(guān)標(biāo)簽