資源描述:
《基于mean-shift算法的目標(biāo)跟蹤技術(shù)的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、畢業(yè)論文(設(shè)計(jì))題目基于mean-shift算法的目標(biāo)跟蹤技術(shù)的研究院系專業(yè)電子信息工程學(xué)生姓名學(xué)號(hào)指導(dǎo)教師職稱_________________二O一二年五月十日目錄摘要2第一章緒論31.1課題研究背景及意義31.2運(yùn)動(dòng)目標(biāo)跟蹤的國(guó)內(nèi)外研究現(xiàn)狀41.3課題研究的主要內(nèi)容及章節(jié)安排6第2章MeanShift理論72.1引言72.2密度估計(jì)概述82.3參數(shù)密度估計(jì)82.4無參密度估計(jì)82.4.1無參密度估計(jì)的常用方法82.4.2核密度估計(jì)原理92.4.3核函數(shù)的選取92.5MeanShift理論102.5.1多維空間下核密度估計(jì)理論102.5.2密度梯度估計(jì)和MeanShif
2、t向量122.5.3MeanShift算法的收斂性14第3章MeanShift目標(biāo)跟蹤算法163.1引言163.2MeanShift算法的步驟173.2.1目標(biāo)模型描述173.2.2候選模型描述173.2.3目標(biāo)相似性度量183.2.4目標(biāo)定位183.3算法的具體實(shí)現(xiàn)203.4目標(biāo)尺度的自適應(yīng)更新223.5實(shí)驗(yàn)結(jié)果分析223.6本章小結(jié)22參考文獻(xiàn)23結(jié)論23致謝23基于mean-shift算法的目標(biāo)跟蹤技術(shù)的研究摘要:基于視頻的運(yùn)動(dòng)目標(biāo)跟蹤是計(jì)算機(jī)視覺研究領(lǐng)域的一項(xiàng)必不可少的關(guān)鍵技術(shù)。MeanShift算法是眾多優(yōu)秀的運(yùn)動(dòng)目標(biāo)跟蹤算法之一。本文的主要研究?jī)?nèi)容為MeanSh
3、ift理論和傳統(tǒng)的MeanShift目標(biāo)跟蹤算法,MeanShift算法采用核顏色直方圖作為描述目標(biāo)的模型,核函數(shù)的單峰性使得該算法對(duì)目標(biāo)的部分遮擋或目標(biāo)變形具有較好的魯棒性,并且具有較好的實(shí)時(shí)性。本文介紹了MeanShift的一些相關(guān)理論,如核密度估計(jì)理論等,解釋了MeanShift向量的概念,并對(duì)MeanShift算法的收斂性進(jìn)行了證明。在MeanShift理論的基礎(chǔ)上,本文詳細(xì)描述了MeanShift應(yīng)用于目標(biāo)跟蹤的具體方法和步驟,同時(shí)提出了尺度自適應(yīng)的更新策略,以滿足跟蹤過程中目標(biāo)尺度的變化要求,還列出了MeanShift算法在各種不同情況下的實(shí)驗(yàn)結(jié)果及分析。關(guān)鍵詞
4、:MeanShift,密度估計(jì),核函數(shù)第一章緒論1.1課題研究背景及意義人類從外部世界獲得的感官信息中,80%以上是來自于視覺。人們通過視覺能力從外界獲取各種事物的圖像信息,視覺系統(tǒng)將這些信息傳遞給大腦進(jìn)行處理,產(chǎn)生含義異常豐富的視覺信息,然后大腦再理解這些視覺信息,從而指導(dǎo)人們進(jìn)行各種相應(yīng)的活動(dòng)讓機(jī)器人具有視覺是人類的一個(gè)夢(mèng)想,機(jī)器擁有人類的視覺功能對(duì)世界產(chǎn)生的影響怎么估計(jì)大概都不為過?,F(xiàn)實(shí)世界中的物體都是三維的,而人眼所獲得的景物圖像是二維的,人類的視覺系統(tǒng)能從二維圖像中獲得三維信息,從而感知三維世界。但是讓機(jī)器擁有這樣的能力卻是非常困難的事情。隨著信號(hào)處理理論的發(fā)展和
5、計(jì)算機(jī)的出現(xiàn),人們似乎發(fā)現(xiàn)了一條模擬人類視覺的可行之路:用攝像機(jī)獲取環(huán)境圖像并轉(zhuǎn)換成數(shù)字信號(hào),用計(jì)算機(jī)通過數(shù)字圖像處理的方法模擬人類對(duì)視覺信息處理的全過程,這樣,就形成了一門新興的學(xué)科—計(jì)算機(jī)視覺。計(jì)算機(jī)視覺是一門綜合性和學(xué)科交叉性很強(qiáng)的學(xué)科,它涉及圖像處理、人工智能、模式識(shí)別、人工神經(jīng)網(wǎng)絡(luò)和數(shù)學(xué)等。其研究目標(biāo)是使計(jì)算機(jī)具有通過二維圖像認(rèn)知三維環(huán)境的能力,這種能力將不僅使機(jī)器能夠感知三維環(huán)境中的形狀、位置、姿勢(shì)等物體的幾何信息,而且更重要的是能夠?qū)@些信息進(jìn)行描述、存儲(chǔ)、識(shí)別和理解。計(jì)算機(jī)視覺的研究始于20世紀(jì)50年代末,到80年代,計(jì)算機(jī)視覺的基本研究中取得了重要進(jìn)展,D
6、avidMarr基于數(shù)學(xué)和神經(jīng)科學(xué)領(lǐng)域的背景提出了比較完善的計(jì)算機(jī)視覺理論,首次從信息處理的角度綜合了圖像處理、心理物理學(xué)和神經(jīng)生理學(xué)等學(xué)科的研究成果,提出了第一個(gè)較為完善的視覺系統(tǒng)框架。20世紀(jì)50年代從統(tǒng)計(jì)模式識(shí)別開始的,當(dāng)時(shí)的工作主要集中在二維圖像的分析和識(shí)別上,如光學(xué)字符識(shí)別,工件表面、顯微圖片和航空?qǐng)D片的分析和解釋等。60年代Robesrt(1965)通過計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對(duì)物體形狀及物體的空間關(guān)系進(jìn)行描述。Rboerts的研究工作開創(chuàng)了以理解三維場(chǎng)景為目的的三維計(jì)算機(jī)視覺的研究。Rboerts對(duì)積木世界的
7、創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復(fù)雜的三維場(chǎng)景。70年代,已經(jīng)出現(xiàn)了一些視覺應(yīng)用系統(tǒng)。70年代中期,麻省理工學(xué)院(MIT)人工智能A(D實(shí)驗(yàn)室正式開設(shè)“計(jì)算機(jī)視覺,(Maehinevision)課程,由國(guó)際著名學(xué)者B.K.P.Horn教授講授。同時(shí),MIT^I實(shí)驗(yàn)室吸引了國(guó)際上許多知名學(xué)者參與計(jì)算機(jī)視覺的理論、算法和系統(tǒng)設(shè)計(jì)的研究,DvadiMarr教授就是其中的一位。他于1973年應(yīng)邀在MTIAI實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組,197