資源描述:
《視頻圖像壓縮中熵編碼技術(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、博士學(xué)位論文視頻圖像壓縮中熵編碼技術(shù)研究RESEARCHONENTROPYCODINGFORVIDEOANDIMAGECOMPRESSION高敏哈爾濱工業(yè)大學(xué)2016年6月國內(nèi)圖書分類號(hào):TP391.41學(xué)校代碼:10213國際圖書分類號(hào):681.39密級(jí):公開博士學(xué)位論文視頻圖像壓縮中熵編碼技術(shù)研究博士研究生:高敏導(dǎo)師:高文教授申請(qǐng)學(xué)位:工學(xué)博士學(xué)科、專業(yè):計(jì)算機(jī)應(yīng)用技術(shù)所在單位:計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院答辯日期:2016年6月授予學(xué)位單位:哈爾濱工業(yè)大學(xué)ClassifiedIndex:TP391.41U.D.C.:681.39DissertationfortheDoctoralDe
2、greeinEngineeringRESEARCHONENTROPYCODINGFORVIDEOANDIMAGECOMPRESSIONCandidate:GaoMinSupervisor:Prof.GaoWenAcademicDegreeAppliedfor:DoctorofEngineeringSpecialty:ComputerApplicationTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:Jun.2016Degree-Conferring-Institution:Harbin
3、InstituteofTechnology摘要摘要在視頻壓縮標(biāo)準(zhǔn)中,熵編碼模塊在信源符號(hào)的壓縮和碼流的組織過程有著不可替代的作用。熵編碼模塊首先利用上下文建模技術(shù)來挖掘信源符號(hào)之間的統(tǒng)計(jì)冗余;然后使用熵編碼引擎(算術(shù)編碼技術(shù)或者變長編碼技術(shù))來去除統(tǒng)計(jì)冗余,進(jìn)而產(chǎn)生緊湊的二進(jìn)制碼流,以供存儲(chǔ)和傳輸。熵編碼模塊通常利用已經(jīng)編碼的符號(hào)來估計(jì)待編碼符號(hào)的概率分布,從而能夠高效地去除信源符號(hào)之間的冗余信息。然而,這種編碼依賴關(guān)系卻不利于熵編碼模塊的并行處理,降低了吞吐率。因此,如何平衡熵編碼模塊的編碼效率和數(shù)據(jù)吞吐率已經(jīng)成為衡量熵編碼技術(shù)優(yōu)劣的重要性能指標(biāo)。隨著高畫質(zhì)視頻的逐步普及,未來的
4、視頻壓縮標(biāo)準(zhǔn)將要處理數(shù)據(jù)量更加龐大的視頻,因此繼續(xù)提高熵編碼模塊的壓縮效率仍然具有很重要的意義。為了克服外界條件的限制,在目前最新的多媒體應(yīng)用中,壓縮感知技術(shù)正在被應(yīng)用于采集數(shù)字圖像/視頻。當(dāng)采用壓縮感知技術(shù)對(duì)圖像/視頻進(jìn)行采集時(shí),得到的測(cè)量值(通常用測(cè)量值表示利用壓縮感知采樣得到的樣本信息)和傳統(tǒng)的圖像/視頻采集方法得到的像素值在本質(zhì)上是不同的。測(cè)量值通常是利用隨機(jī)高斯矩陣對(duì)原始信號(hào)進(jìn)行投影操作而得到的,每個(gè)測(cè)量值都包含了原始信號(hào)的全局信息,并且各個(gè)測(cè)量值之間是相互獨(dú)立的。所以,傳統(tǒng)的圖像/視頻壓縮標(biāo)準(zhǔn)技術(shù)不再適用于測(cè)量值的壓縮。如何充分挖掘測(cè)量值的統(tǒng)計(jì)特性為其設(shè)計(jì)一個(gè)高效的熵編
5、碼器是測(cè)量值壓縮中的一個(gè)新的挑戰(zhàn)問題。所以,在這種研究背景下,本文對(duì)H.264/AVC,HEVC和AVS2等視頻壓縮標(biāo)準(zhǔn)中的熵編碼模塊進(jìn)行優(yōu)化,來提高熵編碼模塊的壓縮效率和數(shù)據(jù)吞吐率;另外,本文也為壓縮感知中測(cè)量值的壓縮設(shè)計(jì)了一個(gè)高效的熵編碼器,來把測(cè)量值轉(zhuǎn)化為緊湊的二進(jìn)制碼流,實(shí)現(xiàn)真正的數(shù)據(jù)壓縮。因此,本文的研究工作主要包括以下四個(gè)部分:第一,在H.264/AVC的上下文自適應(yīng)二進(jìn)制算術(shù)編碼器(CABAC)的設(shè)計(jì)過程中,由于沒有充分地考慮吞吐率這一指標(biāo),使得熵編碼模塊已經(jīng)成為整個(gè)解碼器的主要瓶頸之一。為了提高H.264/AVC中CABAC的吞吐率,本文首先根據(jù)預(yù)測(cè)殘差的DCT系數(shù)
6、的統(tǒng)計(jì)特性,提出了一個(gè)層次依賴上下文模型HDCM(HierarchicalDependencyContextModel)。在HDCM中,DCT系數(shù)塊中的非零系數(shù)的個(gè)數(shù)和DCT系數(shù)的頻域位置被用作為上下文,來挖掘DCT系數(shù)之間的統(tǒng)計(jì)冗余。然后,本文提出了一個(gè)基于層次依賴上下文模型─I─哈爾濱工業(yè)大學(xué)工學(xué)博士學(xué)位論文的二進(jìn)制算術(shù)編碼器HDCMBAC來編碼H.264/AVC中的預(yù)測(cè)殘差的DCT系數(shù)。為了高效地描述DCT系數(shù)塊,并且降低語法元素之間的上下文依賴關(guān)系,HDCMBAC重新設(shè)計(jì)了用于描述DCT系數(shù)塊的語法元素。這些語法元素包括,DCT系數(shù)塊中非零系數(shù)的個(gè)數(shù)N,用于指示每個(gè)位置上的
7、DCT系數(shù)是否為非零系數(shù)的語法元素significant_flag和用于指示每個(gè)非零DCT系數(shù)的幅值的語法元素coeff_abs_level_minus1。實(shí)驗(yàn)結(jié)果表明,與H.264/AVC中的CABAC相比,HDCMBAC可以取得相似的編碼效率,并且最大限度地降低了DCT系數(shù)之間的上下文依賴關(guān)系。第二,為了繼續(xù)提高視頻編碼標(biāo)準(zhǔn)中熵編碼模塊的編碼效率和為下一代視頻編碼標(biāo)準(zhǔn)的制定做技術(shù)儲(chǔ)備,本文以HEVC為基礎(chǔ),提出了一個(gè)內(nèi)存消耗小并且編碼效率高的熵編碼方案,該方案包括