資源描述:
《數(shù)字音頻技術(shù)與杜比ac》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、數(shù)字音頻技術(shù)與杜比AClunouseg(this)">一般來(lái)說(shuō),數(shù)據(jù)壓縮有兩種方法。一種方法是利用信號(hào)的統(tǒng)計(jì)性質(zhì),完全不丟失信息的高效率編碼法,稱為平均信息量編碼或熵編碼(entropycoding)。第二種方法是利用接收信號(hào)人的感覺(jué)特性,省略不必要的信息,壓縮信息量,稱為感覺(jué)編碼(perceptualcoding)。音頻信號(hào)的感覺(jué)編碼是以心理聲學(xué)原理為基礎(chǔ),利用聽(tīng)覺(jué)心理特性,只記錄那些能被人的聽(tīng)覺(jué)所感知的聲音信號(hào),從而達(dá)到減少數(shù)據(jù)量而又降低音質(zhì)的目的。一般而言,人耳的聽(tīng)覺(jué)像20Hz~20kHz帶通濾波器,它對(duì)不同頻率的信號(hào)有不同的感知辨別率。相對(duì)于高頻而言,低頻的聲音更
2、易新人耳感知,其中尤以對(duì)2kHz~4kHz的信號(hào)最為敏感,因而形成了圖1中的絕對(duì)可聞閾曲線。絕對(duì)可聞閾是指寂靜地聽(tīng)覺(jué)可聽(tīng)到的各頻段的最低音量。遮蔽效應(yīng)對(duì)于聽(tīng)覺(jué)特性有著很大的影響。遮蔽分為同時(shí)性的遮蔽和非同時(shí)性的遮蔽。前者是頻域下的一種現(xiàn)象,指在相近的頻率下,強(qiáng)度較大的信號(hào)會(huì)遮蔽較小的信號(hào)。后者也稱時(shí)間的遮蔽性,是指在短暫的時(shí)間間隔內(nèi),強(qiáng)度大的信號(hào)遮蔽較小的信號(hào),它又分為前遮蔽和后遮蔽。前遮蔽是指強(qiáng)度大的信號(hào)遮蔽發(fā)生較早的小信號(hào),后遮蔽則是強(qiáng)度大的信號(hào)遮蔽發(fā)生較晚的小信號(hào)。通常前遮蔽的持續(xù)時(shí)間為20ms,對(duì)再前的聲音的影響幾乎可以忽略;而后遮蔽所產(chǎn)生的效應(yīng)相對(duì)大而且持久,一
3、般可達(dá)100~200ms,所以應(yīng)用更為廣泛。典型的聽(tīng)覺(jué)心理特性如圖1所示的頻率特性(左)和時(shí)間特性(右)。圖1中,噪聲A因在絕對(duì)可聞閾以上而可聞,但噪聲C因在絕對(duì)可聞閾以下,故聽(tīng)不到。如左圖所示,當(dāng)有黑線所示的某頻率信號(hào)存在時(shí),靠近它的本來(lái)可以聽(tīng)見(jiàn)的噪聲B就變得聽(tīng)不見(jiàn)了,這種現(xiàn)象就是同時(shí)性遮蔽效應(yīng)。而如右圖所示,當(dāng)某時(shí)刻有黑線所示的信號(hào)存在時(shí),位于其后面的比它小一些的本來(lái)可聽(tīng)見(jiàn)的噪聲E也變得聽(tīng)不見(jiàn)了,這種現(xiàn)場(chǎng)稱為非同時(shí)性遮蔽效應(yīng)。兩種效應(yīng)合成的結(jié)果形成了實(shí)際的可聞閾。杜比AC-3就是一種感知型編碼方式,它把整個(gè)音頻頻帶分割成若干個(gè)較窄的頻段,因?yàn)槿祟惖穆?tīng)覺(jué)對(duì)不同頻率的聲音
4、具有不同的靈敏度,各頻段的寬度并不完全一樣。由于有用的信號(hào)被劃分成狹窄的頻頻,編碼噪聲的濾降總是就比較容易。因?yàn)閷?duì)于每個(gè)頻段來(lái)說(shuō),該頻率以外的所有信號(hào)可以全部被濾除掉而不會(huì)損傷有用信號(hào)。而頻段內(nèi),剩余噪聲信號(hào)的頻率與有用信號(hào)的頻率非常接近,這正是遮蔽效應(yīng)發(fā)揮最大作用的區(qū)域。從這種意義上說(shuō),象AC-3這樣的感知型編碼系統(tǒng)是一種非常有效的減噪系數(shù)。這些被分割成狹窄頻段的多路數(shù)字音頻信號(hào)最終還需要被合成一路完整的全頻帶信號(hào),但每一個(gè)頻段所占有的數(shù)據(jù)量并不是平均分配的,編碼器內(nèi)部有一個(gè)“聽(tīng)覺(jué)遮蔽模塊”,可以模擬人的聽(tīng)覺(jué)遮蔽效應(yīng),它能根據(jù)信號(hào)的動(dòng)態(tài)特性來(lái)決定在某一時(shí)刻的數(shù)據(jù)用量應(yīng)當(dāng)
5、如何分配給各頻段才是最合適的。頻譜密集、音量大的聲音元素應(yīng)該獲得較多的數(shù)據(jù)占有量,那些由于遮蔽效應(yīng)而聽(tīng)不到的聲音則少占用或不占用數(shù)據(jù)量。500)this.style.ouseg(this)">2AC-3的編解碼技術(shù)簡(jiǎn)介AC-3是在AC-1和AC-2基礎(chǔ)上發(fā)展起來(lái)的多通道編碼技術(shù),保留了原AC-2中如窗函數(shù)處理、指數(shù)變換編碼、自適應(yīng)比特分配等許多特點(diǎn),還新增了運(yùn)用立體聲多聲道的編碼技術(shù)策略的coupling和rematrix算法。一般而言,立體聲的左聲道和右聲道的信號(hào)在聽(tīng)覺(jué)上十分相似,存在著許多重復(fù)的冗余信息,將這兩個(gè)聲道的信號(hào)聯(lián)合起來(lái)加以編碼,便可除去冗余的信號(hào)且不會(huì)影響
6、原來(lái)的音質(zhì)。這里AC-3陣低碼率的又一個(gè)有效的手法。圖2為AC-3編碼器原理框圖。AC-3輸入PC聲音數(shù)據(jù),輸出壓縮后的數(shù)碼流。編碼的第一步是,運(yùn)用TDAC(TimeDomainAliasingCancellation)濾波器把時(shí)域內(nèi)的PC取樣數(shù)據(jù)變換成頻域內(nèi)成塊的一系列變換系數(shù),每個(gè)變換系數(shù)以二進(jìn)制指數(shù)形式表示,即由一個(gè)指數(shù)和一個(gè)尾數(shù)構(gòu)成。指數(shù)部分經(jīng)編碼后構(gòu)成了整個(gè)信號(hào)大致的頻譜,又被稱為頻譜包絡(luò)。用頻譜包括和遮蔽由線的相關(guān)性決定每個(gè)尾數(shù)的比特分配。由于比特分配中采用了前/后向混合自適應(yīng)比特分配以及公共比特池等技術(shù),因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得
7、合理的分配;在對(duì)尾數(shù)的量化過(guò)程中,可對(duì)尾數(shù)進(jìn)行抖晃處理,抖晃所使用的偽隨機(jī)數(shù)生器的可在不同的平臺(tái)上獲得相同的結(jié)果。最后由六個(gè)塊的頻譜包絡(luò)、粗量化的尾數(shù)及相應(yīng)的參數(shù)組成AC-3數(shù)據(jù)幀格式,連續(xù)的幀匯成數(shù)碼流輸出。由時(shí)域變換到頻域的塊長(zhǎng)度的選擇是指數(shù)變換編碼的基礎(chǔ)。在AC-3中定義了兩種長(zhǎng)度切換,一種是512個(gè)樣值點(diǎn)的長(zhǎng)塊,一種是256個(gè)樣值點(diǎn)的短塊。在信號(hào)頻譜分析時(shí),對(duì)要處理的聲道信號(hào)塊區(qū)截取得越長(zhǎng)越好,這樣可以得到較好的頻率分辨力,同時(shí)也能得到較高的編碼效率。但是較長(zhǎng)的數(shù)據(jù)塊可能包含了一些不同一些可能被識(shí)別的噪音,如pre-e