資源描述:
《數(shù)字視頻處理 第6章 數(shù)字視頻編碼標準》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第6章數(shù)字視頻編碼標準6.1概述6.1.1視頻圖像編碼國際標準近年來,國際標準化組織ISO、國際電工委員會IEC和國際電信聯(lián)盟ITU-T相繼制定了一系列視頻圖像編碼的國際標準,有力地促進了視頻信息的廣泛傳播和相關(guān)產(chǎn)業(yè)的巨大發(fā)展。6.1.2視頻編碼標準化組織1.ISOMPEG2.ITU-TVCEG3.JVT6.2JPEG與JPEG20006.2.1JPEG簡介1.JPEG簡介2.?dāng)?shù)據(jù)結(jié)構(gòu)3.基本系統(tǒng)的編碼/解碼(1)DC系數(shù)的編碼(2)AC系數(shù)的編碼圖6-1JPEG標準編/解碼框圖6.2.2JPEG20001JPEG2000簡介JPEG20
2、00標準的主要特點有:①高壓縮率②漸進傳輸③感興趣區(qū)域編碼④碼流的隨機訪問與處理⑤良好的容錯性和開放的框架結(jié)構(gòu)。2.系統(tǒng)框架圖6-2JPEG2000編碼框圖3DC位移、分量變換和分片如果輸入圖像以無符號數(shù)表示,則在進行小波變換前,JPEG2000標準要求對數(shù)據(jù)進行DC位移,即所有樣值減去2p-1,其中p是樣值所用二進制位數(shù)。ICT把把彩色圖像由RGB空間變換到Y(jié)CbCr空間,RCT把彩色圖像由RGB空間變換到Y(jié)UV空間,其變換式為圖6-3JPEG2000分量編碼器4小波變換和量化對于無損壓縮,標準默認使用LeGall(5,3)濾波器實現(xiàn)可
3、逆小波分解,對于有損壓縮,標準默認使用Daubechies(9,7)濾波器。除了采用卷積來實現(xiàn)小波變換外,標準也支持采用其他算法來實現(xiàn)小波變換。JPEG2000標準采用標量量化分為兩種情況對無損編碼,所有的量化步長為1;對有損編碼,每一個圖像片分解后的每個子帶采用一個量化步長,各個子帶步長一般不同。5熵編碼圖6-4碼塊內(nèi)掃描順序圖6-5上下文圖6-6碼塊按層裝配6.3H.26XH.26X是由ITU-T制定的視頻壓縮標準,主要有H.261、H.262、H.263、H.264等。6.3.1H.261H.261標準的碼率為p×64kb/s,其中
4、p為整數(shù),且滿足1≤p≤30,對應(yīng)的碼率為64kb/s~192Mb/s。1.?dāng)?shù)據(jù)組織和系統(tǒng)框架H.261標準將CIF和QCIF格式的數(shù)據(jù)結(jié)構(gòu)劃分為四個層次:圖像層(P)、塊組層(GOB)、宏塊層(MB)和塊層(B)。圖6-7H.261圖像分層結(jié)構(gòu)圖6-8H.261的碼流結(jié)構(gòu)圖6-9H.261的編碼框圖2.幀間/幀內(nèi)模式選擇可根據(jù)交流能量的大小來決定編碼方式:當(dāng)幀內(nèi)交流能量大于幀間交流能量時,采用幀間編碼,反之采用幀內(nèi)編碼;當(dāng)幀間幀內(nèi)交流能量都很小時,采用更加節(jié)省碼率的幀間編碼。設(shè)xk(i,j)和xk-1(i,j)分別是當(dāng)前幀和參考幀宏塊的
5、亮度信號值,則參考幀的幀內(nèi)交流能量為:而前后幀間交流能量為:3.量化對幀內(nèi)編碼模式所產(chǎn)生的直流系數(shù),用步長為8的均勻量化器進行量化。對其他所有的系數(shù),則采用設(shè)置了死區(qū)的均勻量化器來量化,量化器的步長取自區(qū)間[2,62]。所有在死區(qū)內(nèi)的系數(shù)均被量化為0,其它的系數(shù)則按照設(shè)定的步長進行均勻量化。標準規(guī)定,在一個宏塊內(nèi)除了采用幀內(nèi)編碼所得的直流系數(shù)外,所有其他系數(shù)采用同一個量化步長。宏塊間可以改變量化步長。4.運動預(yù)測H.261的運動預(yù)測以宏塊為單位,由亮度分量來決定運動矢量,匹配準則有最小絕對值誤差、最小均方誤差、歸一化互相關(guān)函數(shù)等,標準并沒
6、有限定選用何種準則,也沒有限定使用何種搜索方法進行搜索。6.3.2H.263H.263的改進主要包括支持更多的圖像格式、更有效的運動預(yù)測、效率更高的三維可變長編碼代替二維可變長編碼以及增加了四個可選模式。1.?dāng)?shù)據(jù)組織與系統(tǒng)框架H.263規(guī)定,所有的解碼器必須支持Sub-QCIF和QCIF格式,所有的編碼器必須支持Sub-QCIF和QCIF格式中的一種,其是否支持他格式由用戶決定。H.263規(guī)定,一行中的所有像素只能屬于一個GOB,因此對于不同的格式,一個GOB所包含的MB是不同的,對應(yīng)的行數(shù)也是不同的。圖6-10H.263中QCIF的分層
7、結(jié)構(gòu)圖6-11H.263編碼器框圖2.運動預(yù)測1)半象素精度運動矢量預(yù)測2)運動矢量的差分編碼圖6-13運動矢量預(yù)測編碼3.可選模式1)無限制運動矢量模式2)基于語法的算術(shù)編碼模式3)先進預(yù)測模式4)PB圖像模式6.3.3H.2641.結(jié)構(gòu)框架2.VCL的數(shù)據(jù)組織3.檔次4.編解碼器結(jié)構(gòu)5.宏塊預(yù)測6.變換7.重排序8.改進的熵編碼9.去塊效應(yīng)濾波器6.4MPEGMPEG系列標準闡明了編碼解碼的過程,嚴格規(guī)定的編碼后產(chǎn)生的數(shù)據(jù)流的句法結(jié)構(gòu),但并沒有規(guī)定編碼解碼的算法。6.4.1MPEG-1MPEG-1的正式名稱是“用于數(shù)字存儲媒體的1.5
8、Mbit/s以下的活動圖像及相關(guān)音頻編碼”(ISO/IEC11172),它包括五個部分:系統(tǒng)、視頻、音頻、一致性和軟件。1.?dāng)?shù)據(jù)組織和整體框架MPEG-1采用源輸入格式SIF(SourceIn