資源描述:
《【碩士論文】H.264編碼器關(guān)鍵算法的實現(xiàn)和優(yōu)化研究.pdf》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、浙江大學(xué)信息科學(xué)與工程學(xué)院碩士學(xué)位論文H.264編碼器關(guān)鍵算法的實現(xiàn)和優(yōu)化研究姓名:張凱舟申請學(xué)位級別:碩士專業(yè):信息與通信工程指導(dǎo)教師:姚慶棟20080501浙江大學(xué)碩:l:學(xué)位論文摘要H.264/AVC是視頻編碼專家組lTU.T和運動圖像專家組MPEG共同制定的視頻編碼標(biāo)準(zhǔn)。與現(xiàn)有的標(biāo)準(zhǔn)相比,H.264獲得了更高的壓縮性能,同時具有更好的網(wǎng)絡(luò)適應(yīng)性。但這些優(yōu)勢的取得都是以增加運算開銷為代價的。對硬件的存儲空間和處理能力提出了更高的要求。因此如何設(shè)計高性能的編解碼器成為學(xué)術(shù)領(lǐng)域和工業(yè)領(lǐng)域研究的重點問題。在H.264編碼器中運動估計是其關(guān)鍵的一項技術(shù),通過運動估計能很好的消除幀間的相關(guān)性,由
2、于H.264采用了多種塊劃分模式和l/4像素精度的運動估計,這極大的提高了運動估計模塊的計算復(fù)雜度,其計算時間占整個編碼器的60%(單幀參考)到80%(5幀參考),為了降低快速運動估計的計算復(fù)雜度,同時避免采用小菱形搜索算法可能帶來的局部最優(yōu)點問題,本文提出了自適應(yīng)搜索模板的估計算法。本算法在搜索時根據(jù)SAD(sumofabsolutedifferences)值的變化快慢和相鄰幀之間時間相關(guān)性自適應(yīng)選擇搜索模板。實驗表明,使用本算法編碼,碼流人小與使用菱形搜索算法和六邊形搜索算法差距為士O.6%,搜索點數(shù)為菱形算法的72%-77%,六邊形算法的83%-86%,在減少搜索點數(shù)的情況下有效地避免
3、了局部最優(yōu)點問題。在H.264的編碼器中每個塊的編碼都離不開量化,變換,反量化,反變換,1/21/4像素插值,濾波和SAD求值的過程,且在這些計算中大量的過程可以并行處理,于是本文利用MD64的“位和128位的SIMD指令進(jìn)行算法的優(yōu)化并提出了利用128位SIMD(SingleInstructionMultipleData)指令并行處理2個4x4塊變換的算法,同時提出了利于并行處理的濾波算法,該算法通過增加單個濾波計算的計算量換取了利于并行處理的計算形式,有利于采用SIMD指令編程處理,從而在通過SIMD指令優(yōu)化后提升了濾波速度。這些算法使得以往H.264編碼中耗時很大的模塊的速度得到3.8
4、倍的提升從而大大提高了編碼速度。最后,本文對基于MD64的H.264編碼器的存儲結(jié)構(gòu)優(yōu)化作了研究,在一個基于DSP的軟件編碼器中數(shù)據(jù)的訪問量是很大的,如何安排這些數(shù)據(jù)的存儲結(jié)構(gòu)直接影響了數(shù)據(jù)的訪問速度,所以存儲結(jié)構(gòu)設(shè)計成為了編碼器設(shè)計的重要組成部分,合理的存儲結(jié)構(gòu)設(shè)計不但利于提高數(shù)據(jù)的訪問速度同時利于不同平臺的移植。本文考慮了MD64的片內(nèi)存儲空間的大小問題同時考慮到其DMA帶來的數(shù)據(jù)傳輸和數(shù)據(jù)計算并行化的可能性,提出了一種精簡的片上存儲空問的分配方法,利用MD64的DMA實現(xiàn)了片上與片外間數(shù)據(jù)的調(diào)度和DSP上數(shù)據(jù)的處理完全并行化。關(guān)鍵詞:H.264,運動補(bǔ)償,MD64,SIMD指令,存儲結(jié)
5、構(gòu)優(yōu)化浙江大學(xué)碩士學(xué)位論文AbstractH.264/AVCisavideocodingstandarddevelopedbyITU·TandMovingPictureExpertsGroup(MPEG)together.Comparingwithotherexistingcodingstandards.H.264achievesbettercompressionperformanceandhasbetternetworkadaptability.Howevertheseadvantagesareobtainedbyincreasingcomputationalcomplexitywhich
6、leadsmorerequirementsonstorageandprocessingcapabilityofhardware.Duetothereasonabove.howtodesignahighperformancecoderbecomesallimportantprobleminacademicandindustrialfieldMotioncompensationisakeycomponentofH.264encoderthroughwhichredundanciesofsuccessiveframecallberemoveeffectively.Duetotheuseofvari
7、ableblockpartitionmodesandquarter-pixelaccuracymotionestimationthecomputationalcomplexityishighlyincreasedanditconsumes60%(1referenceframe)to80%(5referenceframes)ofthetotalencodingtimeofthewholeencodingtime