網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準

網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準

ID:43243124

大小:1.08 MB

頁數(shù):164頁

時間:2019-10-07

網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準_第1頁
網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準_第2頁
網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準_第3頁
網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準_第4頁
網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準_第5頁
資源描述:

《網(wǎng)絡多媒體技術(西電版)第3章多媒體數(shù)據(jù)壓縮編碼標準》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫

1、第3章多媒體數(shù)據(jù)壓縮編碼標準3.1音頻壓縮編碼標準3.2圖像壓縮編碼標準3.3視頻壓縮編碼標準3.4本章小結思考練習題在多媒體系統(tǒng)中,多媒體數(shù)據(jù)編碼標準是系統(tǒng)設計、開發(fā)和應用的基礎。本章介紹音頻、圖像及視頻壓縮編碼標準。3.1.1音頻信息的編碼分類在實際應用中,音頻壓縮技術的選擇需要綜合考慮音頻質(zhì)量、壓縮比、計算復雜度等因素。常用的音頻壓縮編碼可分為波形編碼、參數(shù)編碼、混合編碼和感知編碼等。3.1音頻壓縮編碼標準1.波形編碼波形編碼是基于信號統(tǒng)計特性進行音頻壓縮的編碼方法,是直接對音頻樣值進行的編碼,它在時域上進行處理,保留了信號

2、的各種過渡特征,力圖使重建的音頻波形盡可能與原波形一致。波形編碼的技術主要有非線性量化技術、時域自適應差分編碼和量化技術。非線性量化技術利用小幅度語音信號出現(xiàn)的概率大而大幅度語音信號出現(xiàn)的概率小的特點,通過為小信號分配小的量化階,為大信號分配大的量化階來減少總量化誤差。自適應差分編碼和量化技術是利用過去的語音來預測當前的語音,只對它們的差值進行編碼,從而大大降低了數(shù)據(jù)率;根據(jù)量化數(shù)據(jù)的動態(tài)范圍來動態(tài)調(diào)整量化階,即采用自適應量化技術,使得量化階與量化數(shù)據(jù)相匹配。波形編碼是最簡單也是應用最早的音頻編碼方法,具有實施簡單、適應性強、音頻

3、質(zhì)量好等特點,其不足之處是壓縮比不高,數(shù)據(jù)率較大。典型的波形編碼包括脈沖編碼調(diào)制(PCM)、差值量化(DPCM)、自適應量化(APCM)和自適應差值量化(ADPCM)編碼等。2.參數(shù)編碼參數(shù)編碼是基于聲學參數(shù)進行音頻數(shù)據(jù)壓縮的編碼方法。人類的發(fā)聲器官產(chǎn)生聲音的過程可以用一個數(shù)學模型來逼近,參數(shù)編碼就是通過計算表征這個發(fā)聲模型的參數(shù)并對其進行編碼來進一步降低數(shù)據(jù)率的。常用的音頻參數(shù)有共振峰、線性預測系數(shù)、濾波器組等。參數(shù)編碼的優(yōu)點是壓縮比高,語音編碼速率較低,基本上在2~9.6kb/s之間。其缺點首先是合成語音質(zhì)量較差,往往清晰度滿

4、足要求而自然度不好,難于辨認說話人是誰;其次是電路實現(xiàn)的復雜度比較高。目前,編碼速率小于16kb/s的低比特語音編碼大都采用參數(shù)編碼。參數(shù)編碼在移動通信、多媒體通信和IP網(wǎng)絡電話應用中都起到了重要的作用。參數(shù)編碼的典型代表是線性預測編碼(LPC)。3.混合編碼混合編碼是將波形編碼的高質(zhì)量與參數(shù)編碼的低數(shù)據(jù)率結合起來的編碼方法,以求能在較低數(shù)據(jù)率下獲得較高的音質(zhì)。其基本原理是合成分析方法,即將綜合濾波器引入編碼器,與分析器相結合,在編碼器中將激勵輸入綜合濾波器,產(chǎn)生與譯碼器端完全一致的合成語音,然后將合成語音與原始語音相比較(波形編

5、碼思想),根據(jù)均方誤差最小原則,求得最佳的激勵信號,然后把激勵信號以及分析出來的綜合濾波器編碼送給解碼端。這種得到綜合濾波器和最佳激勵的過程稱為分析(得到語音參數(shù)),用激勵和綜合濾波器合成語音的過程稱為綜合。由此可見,混合編碼把參數(shù)編碼和波形編碼的優(yōu)點結合在了一起,使得用較低碼率產(chǎn)生較好的音質(zhì)成為可能。常見的混合編碼包括碼本激勵線性預測編碼(CELP)、多脈沖激勵線性預測編碼(MPLPC)、多脈沖最大似然量化編碼(MP-MLQ)以及G.728、GSM標準等。4.感知編碼感知編碼是基于人耳的聽覺特性,通過消除不被感知的冗余信息來實現(xiàn)

6、對音頻數(shù)據(jù)壓縮的編碼方法。它基于心理聲學模型,利用人的聽覺閾值特性和掩蔽效應,通過給不同頻率處的信號數(shù)據(jù)分量分配以不同量化比特的方法來控制量化噪聲,使得噪聲能量低于掩蔽閾值,即把壓縮帶來的失真控制在聽閾以下,使人耳覺察不到失真的存在,從而實現(xiàn)更高效率的音頻壓縮。目前,在高質(zhì)量音頻編碼標準中,心理聲學模型是一個最為有效的算法模型。在此類編碼中,以MPEG音頻編碼(MPEGLayer-1、2、3和AAC標準)和DolbyDigital的應用最為廣泛。3.1.2音頻壓縮編碼標準音頻信號的壓縮編碼主要包括ITU制定的G.7XX系列和ISO

7、/IEC制定的MPEG-X系列標準。1.G.7XX系列中的波形編碼標準采用波形編碼的編碼標準有G.711標準、G.721標準和G.722標準。1)G.711標準G.711標準是在1972年提出的,它是為脈沖編碼調(diào)制(PCM)制定的標準。從壓縮編碼的評價來看,這種編碼方法的語音質(zhì)量好,算法延時幾乎可以忽略不計,但缺點是壓縮率很有限。G.711針對的是電話質(zhì)量的窄帶語音信號,頻率范圍是0.3~3.4kHz,采樣頻率采用8kHz,每個采樣樣值用8位二進制碼編碼,其速率為64kb/s。G.711標準推薦采用非線性壓縮擴張技術,壓縮方式有

8、A律和μ律兩種。由于使用了壓縮擴張技術,其編碼方式為非線性編碼,而其編碼質(zhì)量卻與11比特線性量化編碼質(zhì)量相當。在5級的MOS評價等級中,其評分等級達到4.3,語音質(zhì)量很好;編/解碼延時只有0.125ms,可以忽略不計;算法的復雜度是最低的,定為1,

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。