資源描述:
《基于塊匹配算法的運動估計概要.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于塊匹配算法的運動估計摘要:本文首先介紹了運動估計和塊匹配的概念和思想,然后詳細介紹了塊匹配的搜索算法。最后根據(jù)塊匹配算法的運動估計給出了一個設(shè)計。關(guān)鍵字:運動估計,塊匹配,算法1研究背景隨著現(xiàn)代信息社會對通信業(yè)務(wù)要求的不斷增長,圖像通信與通信網(wǎng)容量的矛盾日益突出,尤其是具有龐大數(shù)據(jù)量的視頻圖像通信,更是很難傳輸和存儲,極大的制約了圖像通信的發(fā)展。例如,按CCIR601建議,普通質(zhì)量的電視信號數(shù)字視頻的碼率約為216Mbit/s,而高清晰度電視HDTV則在1.2Gb/s以上,如果沒有高效率的壓縮技術(shù),則難以傳輸和存儲。而運動檢測與估計
2、不僅是軍事領(lǐng)域中目標(biāo)探測與跟蹤的有效技術(shù)之一,同時也是視頻圖象編碼與壓縮的常用方法與核心技術(shù)。因此,該項研究對于復(fù)雜背景下的目標(biāo)探測以及視頻處理均具有重要的應(yīng)用價值。運動估計和運動補償是緊密聯(lián)系的,它是視頻圖像壓縮編碼中使用的一項核心技術(shù),很好的解決了視頻圖像中時間冗余的問題,經(jīng)驗表明,實用化的壓縮方法可以將運動圖像數(shù)據(jù)壓縮30倍而不失真。運動估計技術(shù)主要分為兩大類:象素遞歸法和塊匹配法。考慮到計算復(fù)雜度和實時性要求,塊匹配法已成為目前最常用的方法。顯然,要想獲得好的運動補償,關(guān)鍵是要有準(zhǔn)確的運動估計,因此運動估計算法的研究成為視頻壓縮
3、算法的研究重點。運動估計研究的主要內(nèi)容就是如何快速、有效的獲得有足夠精度的運動矢量。即把前一幀的運動部分根據(jù)運動矢量補過來,同時用其它方法得到其剩余的不同部分的過程稱為運動補償(MotionCompensation,MC)。就這樣,采用運動估計和補償可以有效地去除視頻信號在時間方向的重復(fù)信息,達到壓縮的目的。其中,在這方面的一種有效方法就是塊匹配運動估計BMME(Block-MatchingMotionEstimation),它目前已被許多視頻編碼標(biāo)準(zhǔn)所采納。為了提高搜索速度和效率,目前研究最多的是基于塊匹配(BlockMatching
4、,BM)的快速搜索算法,例如三步法,四步法,二維對數(shù)法,菱形法等。隨著計算機網(wǎng)絡(luò)的普及和發(fā)展,很多信息可以通過網(wǎng)絡(luò)實現(xiàn)共享。形色兼具的視頻信息在網(wǎng)絡(luò)傳輸?shù)男畔⒅兴紦?jù)的比例也越來越高。但由于視頻信息本身十分龐大,限制了其在網(wǎng)絡(luò)中的傳播速度。于是視頻信息的壓縮成為視頻傳輸?shù)囊粋€重要環(huán)節(jié)。數(shù)字視頻信息是由數(shù)字圖像的時間序列構(gòu)成的,每一幅數(shù)字圖像稱為一幀。視頻編碼的一個主(frame)要目的就是在保證一定重構(gòu)質(zhì)量的前提下,以盡量少的比特數(shù)來表征視頻信息。視頻編碼是視頻壓縮的關(guān)鍵技術(shù)。視頻編碼與的原理是:由于表示圖像和視頻信息所需的大量的數(shù)據(jù)往
5、往是高度相關(guān)的,這些相關(guān)性會引起信息的冗余,因此可以通過去除這些冗余信息來實現(xiàn)對視頻數(shù)據(jù)的壓縮。靜止圖像的壓縮是在保持重建圖像質(zhì)量可以接收的同時,盡量去除圖像本身存在的空間冗余,而視頻信號的壓縮,除了去除空間冗余之外,還可以通過去除時間冗余達到較高的壓縮比。運動估計技術(shù)是視頻圖像壓縮編碼中使用的一項核心技術(shù),很好的解決了視頻圖像中時間冗余的問題,運動估計技術(shù)主要分為兩大類:象素遞歸法和塊匹配算法??紤]到計算復(fù)雜度和實時性要求,塊匹配法已成為目前最常用的方法。2實驗原理如圖1所示,運動估計的基本思想是將圖像序列的每一幀圖像分成許多互不重疊
6、的宏塊,并假設(shè)塊內(nèi)各像素只作相等的平移,然后對于當(dāng)前幀中的每一塊到前一幀或后一幀某一給定搜索范圍內(nèi)根據(jù)一定的匹配準(zhǔn)則找出與當(dāng)前塊最相似的塊,即匹配塊,由匹配塊與當(dāng)前塊的相對位置計算出運動位移,所得運動位移即為當(dāng)前塊的運動矢量。宏塊大小為M×N,一般取16×16。搜索范圍一般由最大偏移矢量來決定,設(shè)可能的最大偏移矢量為(dxmax,dymax),則搜索范圍為(M+2dxmax)×(N+2dymax)。圖1運動估計基本原理2.1塊匹配介紹按照一般的想法,運動估計應(yīng)當(dāng)首先將圖像中靜止背景和運動物體區(qū)分開來,然后對運動物體的實際位移進行估計。但
7、塊匹配方法卻不是這樣,它的思想是將圖像劃分為許多互不重疊的子塊(例如16×16),并認為子塊內(nèi)所有像素的位移量都相同。這意味著每個子塊被視為運動物體。假設(shè)在圖像序列中,t時刻對應(yīng)于第k幀圖像,t-τ時刻對應(yīng)于第k-1幀圖像。對于k幀中的一個子塊,在k-1幀中尋找與其最相似的子塊,這個過程稱為尋找匹配塊,并認為該匹配塊在k-1幀中所處的位置就是k幀子塊位移前的位置,這種位置的變化用運動矢量D來表示。將圖像分割成M×N的小塊,并假設(shè)塊內(nèi)象素作相同的運動,且只作平移運動。雖然實際上塊內(nèi)各點運動不一定相同,也不定只有平移運動,但當(dāng)M×N較小時,
8、上述假設(shè)可近似成立。這樣做的目的只是為了簡化運算。塊匹配法對當(dāng)前幀圖像的每一塊,在上一幀的一定范圍內(nèi)搜索最優(yōu)匹配,并認為本塊就是從上一幀最優(yōu)匹配塊位置處平移過來的。設(shè)可能的最大偏移矢量為(r,r),則搜索范