資源描述:
《圖像與視頻編解碼技術(shù)-revised.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、目錄摘要2第一部分概述3一、圖像/視頻編碼的必要性與可行性31.編碼的必要性32.編碼的可行性3二、圖像/視頻編碼的關(guān)系4三、圖像/視頻編碼的評(píng)估4第二部分靜止圖像編解碼技術(shù)6一、靜止圖像編解碼中的主要方法與技術(shù)61.熵編碼62.源編碼83.量化10二、小波圖像編碼與分形圖像編碼111.小波圖像編碼112.分形圖像編碼13三、國(guó)際標(biāo)準(zhǔn)JPEG與JPEG2000141.JPEG142.JPEG200015第三部分視頻編解碼技術(shù)18一、視頻編碼國(guó)際標(biāo)準(zhǔn)181.MPEG-1182.MPEG-2203.MPEG-4204.MPEG-7與MPEG-21225.H
2、.261236.H.263247.H.26424二、視頻編碼中的一些特殊技術(shù)301.運(yùn)動(dòng)估計(jì)技術(shù)302.差錯(cuò)糾正技術(shù)32第四部分與手持設(shè)備相結(jié)合的視頻編解碼35一、無(wú)線網(wǎng)絡(luò)環(huán)境35二、手持移動(dòng)計(jì)算設(shè)備的特點(diǎn)36三、視頻國(guó)際標(biāo)準(zhǔn)之間的比較與相關(guān)思考36參考文獻(xiàn)38摘要視覺是人類獲取信息的主要途徑,圖像與視頻在人與計(jì)算機(jī)的交互過程中扮演著重要的角色。隨著編解碼技術(shù)的不斷發(fā)展,與圖像和視頻相關(guān)的電子產(chǎn)品正逐步進(jìn)入普通人的生活并變得越來越不可或缺。近年來,以手機(jī)為代表的手持移動(dòng)計(jì)算設(shè)備正日益成為普通人工作生活中的一部分,越來越多的用戶希望能夠通過手機(jī)點(diǎn)播視頻節(jié)
3、目甚至是進(jìn)行可視通話。為滿足這些需求必須去研究與手持設(shè)備相關(guān)的視頻編解碼問題。本文是對(duì)視頻編解碼學(xué)習(xí)的一個(gè)總結(jié),主要介紹了視頻編解碼和與其關(guān)系十分密切的圖像編解碼中的相關(guān)技術(shù)與國(guó)際標(biāo)準(zhǔn),其中重點(diǎn)介紹了新的視頻國(guó)際標(biāo)準(zhǔn)H.264中的技術(shù)方法與特性,并在最后對(duì)手持設(shè)備上視頻編解碼的特殊性以及視頻編解碼技術(shù)可能的發(fā)展方向做了一些思考和探討。關(guān)鍵詞:視頻編解碼,圖像編解碼,H.264,手持設(shè)備第一部分概述一、圖像/視頻編碼的必要性與可行性1.編碼的必要性21世紀(jì)的人們面臨的是一個(gè)信息化的社會(huì)。數(shù)字化后的信息,尤其是數(shù)字化后的圖像和視頻信息具有數(shù)據(jù)海量性,這給信
4、息的存儲(chǔ)和傳輸造成了較大的困難,成為阻礙人類有效的獲取和使用這此信息的瓶頸問題之一。因此,研究和開發(fā)新型有效的多媒體數(shù)據(jù)壓縮編碼方法,以壓縮的形式存儲(chǔ)和傳輸這些數(shù)據(jù)將是最好的選擇。原始彩色圖像本身數(shù)據(jù)量相當(dāng)巨大,以一幅普通的1024*768的圖片為例,如果對(duì)RGB三個(gè)分量都進(jìn)行了256級(jí)量化,占用一個(gè)字節(jié),就是說使用24位bmp位圖格式而完全不進(jìn)行壓縮的話,其數(shù)據(jù)文件大小為1024*768*24=18Mbit。再以陸地衛(wèi)星(Landsat—3)為例子,其水平、垂直分辨率分別為2340和3240,四波段采樣精度7位,它的一幅圖像的數(shù)據(jù)量為2340×324
5、0×7×4=212Mbit,按每天30幅計(jì)每天數(shù)據(jù)為212×30=6.36Gbit,每年的數(shù)據(jù)量高達(dá)2300Gbit。這么大的數(shù)據(jù)量無(wú)疑給存儲(chǔ)器的存儲(chǔ)容量、通信干線的信道傳輸率以及計(jì)算機(jī)的運(yùn)算速度都增加了極大的壓力。單純用擴(kuò)大存儲(chǔ)容量,增加通信干線的傳輸率是不現(xiàn)實(shí)的,數(shù)據(jù)壓縮是行之有效的方法。2.編碼的可行性有意義的、可被人理解的圖像中存在著很多冗余信息,因此對(duì)圖像/視頻進(jìn)行數(shù)據(jù)壓縮是有可能的。通過人們多年的研究與實(shí)踐證明,這種冗余不僅存在而且占了原始數(shù)據(jù)中的絕大部分。也就是說,通過精心設(shè)計(jì)壓縮算法,人們可以用極少量的信息精確表示原始的海量信息。圖像/
6、視頻中的冗余信息主要包括統(tǒng)計(jì)冗余、結(jié)構(gòu)冗余、知識(shí)冗余和視覺冗余等幾類:l統(tǒng)計(jì)冗余:統(tǒng)計(jì)冗余包括信息熵冗余、空間冗余和視頻中的時(shí)間冗余。在把圖像看成完全無(wú)意義的比特流后,按照信息論的有關(guān)原理,對(duì)該比特流只需按其信息熵的大小分配相應(yīng)比特?cái)?shù)即可完全精確的表示之。l結(jié)構(gòu)冗余:在有些圖像的部分區(qū)域內(nèi)存在著非常強(qiáng)的紋理結(jié)構(gòu),或是圖像的各個(gè)部分之間存在有某種關(guān)系,例如自相似性等,這些都是結(jié)構(gòu)冗余的表現(xiàn)。l知識(shí)冗余:在有些圖像在包含的信息與某些先驗(yàn)的基礎(chǔ)知識(shí)有關(guān),例如在一幅人頭部特寫的圖像中,頭、眼、鼻和嘴的相互位置關(guān)系屬于一般常識(shí),這種冗余稱為知識(shí)冗余。l視覺冗余:
7、人類的視覺系統(tǒng)對(duì)于圖像的注意是非均勻和非線性的,并不是對(duì)于圖像中的任何變化都能感知。這種由于人眼特性產(chǎn)生的冗余稱為視覺冗余。上述各種形式的冗余,是壓縮圖像與視頻數(shù)據(jù)的出發(fā)點(diǎn)。圖像與視頻編碼的目標(biāo)就是要盡可能消除這些冗余信息,以減少表示圖像與視頻所需的數(shù)據(jù)量。二、圖像/視頻編碼的關(guān)系圖像編碼與視頻編碼有著非常密切的關(guān)系。圖像編碼是視頻編碼的基礎(chǔ),視頻可以看成是一個(gè)連續(xù)的靜止圖像的序列,研究如何對(duì)靜止圖像進(jìn)行有效的編碼對(duì)視頻編碼的研究有著至關(guān)重要的作用。二者在技術(shù)上有很大的交融,靜止圖像壓縮中的方法和思想在視頻壓縮中也經(jīng)常會(huì)用到。當(dāng)然,由于多出了一個(gè)時(shí)間維
8、,視頻壓縮技術(shù)又有著不同于靜止圖像壓縮的獨(dú)特之處。因此本文將先在第二部分中對(duì)靜止圖像編碼技術(shù)進(jìn)