網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準

ID：43243124

大小：1.08 MB

頁數(shù)：164頁

時間：2019-10-07

網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準_第1頁

網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準_第2頁

網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準_第3頁

網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準_第4頁

網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準_第5頁

資源描述：

《網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準》由會員上傳分享，免費在線閱讀，更多相關內(nèi)容在教育資源-天天文庫。

1、第3章多媒體數(shù)據(jù)壓縮編碼標準3.1音頻壓縮編碼標準3.2圖像壓縮編碼標準3.3視頻壓縮編碼標準3.4本章小結思考練習題在多媒體系統(tǒng)中，多媒體數(shù)據(jù)編碼標準是系統(tǒng)設計、開發(fā)和應用的基礎。本章介紹音頻、圖像及視頻壓縮編碼標準。3.1.1音頻信息的編碼分類在實際應用中，音頻壓縮技術的選擇需要綜合考慮音頻質(zhì)量、壓縮比、計算復雜度等因素。常用的音頻壓縮編碼可分為波形編碼、參數(shù)編碼、混合編碼和感知編碼等。3.1音頻壓縮編碼標準1.波形編碼波形編碼是基于信號統(tǒng)計特性進行音頻壓縮的編碼方法，是直接對音頻樣值進行的編碼，它在時域上進行處理，保留了信號

2、的各種過渡特征，力圖使重建的音頻波形盡可能與原波形一致。波形編碼的技術主要有非線性量化技術、時域自適應差分編碼和量化技術。非線性量化技術利用小幅度語音信號出現(xiàn)的概率大而大幅度語音信號出現(xiàn)的概率小的特點，通過為小信號分配小的量化階，為大信號分配大的量化階來減少總量化誤差。自適應差分編碼和量化技術是利用過去的語音來預測當前的語音，只對它們的差值進行編碼，從而大大降低了數(shù)據(jù)率；根據(jù)量化數(shù)據(jù)的動態(tài)范圍來動態(tài)調(diào)整量化階，即采用自適應量化技術，使得量化階與量化數(shù)據(jù)相匹配。波形編碼是最簡單也是應用最早的音頻編碼方法，具有實施簡單、適應性強、音頻

3、質(zhì)量好等特點，其不足之處是壓縮比不高，數(shù)據(jù)率較大。典型的波形編碼包括脈沖編碼調(diào)制(PCM)、差值量化(DPCM)、自適應量化(APCM)和自適應差值量化(ADPCM)編碼等。2.參數(shù)編碼參數(shù)編碼是基于聲學參數(shù)進行音頻數(shù)據(jù)壓縮的編碼方法。人類的發(fā)聲器官產(chǎn)生聲音的過程可以用一個數(shù)學模型來逼近，參數(shù)編碼就是通過計算表征這個發(fā)聲模型的參數(shù)并對其進行編碼來進一步降低數(shù)據(jù)率的。常用的音頻參數(shù)有共振峰、線性預測系數(shù)、濾波器組等。參數(shù)編碼的優(yōu)點是壓縮比高，語音編碼速率較低，基本上在2~9.6kb/s之間。其缺點首先是合成語音質(zhì)量較差，往往清晰度滿

4、足要求而自然度不好，難于辨認說話人是誰；其次是電路實現(xiàn)的復雜度比較高。目前，編碼速率小于16kb/s的低比特語音編碼大都采用參數(shù)編碼。參數(shù)編碼在移動通信、多媒體通信和IP網(wǎng)絡電話應用中都起到了重要的作用。參數(shù)編碼的典型代表是線性預測編碼(LPC)。3.混合編碼混合編碼是將波形編碼的高質(zhì)量與參數(shù)編碼的低數(shù)據(jù)率結合起來的編碼方法，以求能在較低數(shù)據(jù)率下獲得較高的音質(zhì)。其基本原理是合成分析方法，即將綜合濾波器引入編碼器，與分析器相結合，在編碼器中將激勵輸入綜合濾波器，產(chǎn)生與譯碼器端完全一致的合成語音，然后將合成語音與原始語音相比較(波形編

5、碼思想)，根據(jù)均方誤差最小原則，求得最佳的激勵信號，然后把激勵信號以及分析出來的綜合濾波器編碼送給解碼端。這種得到綜合濾波器和最佳激勵的過程稱為分析(得到語音參數(shù))，用激勵和綜合濾波器合成語音的過程稱為綜合。由此可見，混合編碼把參數(shù)編碼和波形編碼的優(yōu)點結合在了一起，使得用較低碼率產(chǎn)生較好的音質(zhì)成為可能。常見的混合編碼包括碼本激勵線性預測編碼(CELP)、多脈沖激勵線性預測編碼(MPLPC)、多脈沖最大似然量化編碼(MP-MLQ)以及G.728、GSM標準等。4.感知編碼感知編碼是基于人耳的聽覺特性，通過消除不被感知的冗余信息來實現(xiàn)

6、對音頻數(shù)據(jù)壓縮的編碼方法。它基于心理聲學模型，利用人的聽覺閾值特性和掩蔽效應，通過給不同頻率處的信號數(shù)據(jù)分量分配以不同量化比特的方法來控制量化噪聲，使得噪聲能量低于掩蔽閾值，即把壓縮帶來的失真控制在聽閾以下，使人耳覺察不到失真的存在，從而實現(xiàn)更高效率的音頻壓縮。目前，在高質(zhì)量音頻編碼標準中，心理聲學模型是一個最為有效的算法模型。在此類編碼中，以MPEG音頻編碼(MPEGLayer-1、2、3和AAC標準)和DolbyDigital的應用最為廣泛。3.1.2音頻壓縮編碼標準音頻信號的壓縮編碼主要包括ITU制定的G.7XX系列和ISO

7、/IEC制定的MPEG-X系列標準。1.G.7XX系列中的波形編碼標準采用波形編碼的編碼標準有G.711標準、G.721標準和G.722標準。1)G.711標準G.711標準是在1972年提出的，它是為脈沖編碼調(diào)制(PCM)制定的標準。從壓縮編碼的評價來看，這種編碼方法的語音質(zhì)量好，算法延時幾乎可以忽略不計，但缺點是壓縮率很有限。G.711針對的是電話質(zhì)量的窄帶語音信號，頻率范圍是0.3~3.4kHz，采樣頻率采用8kHz，每個采樣樣值用8位二進制碼編碼，其速率為64kb/s。G.711標準推薦采用非線性壓縮擴張技術，壓縮方式有

8、A律和μ律兩種。由于使用了壓縮擴張技術，其編碼方式為非線性編碼，而其編碼質(zhì)量卻與11比特線性量化編碼質(zhì)量相當。在5級的MOS評價等級中，其評分等級達到4.3，語音質(zhì)量很好；編/解碼延時只有0.125ms，可以忽略不計；算法的復雜度是最低的，定為1，

當前文檔最多預覽五頁，下載文檔查看全文

侵權申訴



1 1 2 3 4 5 / 164



此文檔下載收益歸作者所有

當前文檔最多預覽五頁，下載文檔查看全文

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準

網(wǎng)絡多媒體技術（西電版）第3章多媒體數(shù)據(jù)壓縮編碼標準

相關文章

相關標簽