資源描述:
《基于mean-shift算法的目標跟蹤技術的研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、畢業(yè)論文(設計)題目基于mean-shift算法的目標跟蹤技術的研究院系專業(yè)電子信息工程學生姓名學號指導教師職稱_________________二O一二年五月十日目錄摘要2第一章緒論31.1課題研究背景及意義31.2運動目標跟蹤的國內外研究現(xiàn)狀41.3課題研究的主要內容及章節(jié)安排6第2章MeanShift理論72.1引言72.2密度估計概述82.3參數(shù)密度估計82.4無參密度估計82.4.1無參密度估計的常用方法82.4.2核密度估計原理92.4.3核函數(shù)的選取92.5MeanShift理論102.5.1多維空間下核密度估計理論102.5.2密度梯度估計和MeanShif
2、t向量122.5.3MeanShift算法的收斂性14第3章MeanShift目標跟蹤算法163.1引言163.2MeanShift算法的步驟173.2.1目標模型描述173.2.2候選模型描述173.2.3目標相似性度量183.2.4目標定位183.3算法的具體實現(xiàn)203.4目標尺度的自適應更新223.5實驗結果分析223.6本章小結22參考文獻23結論23致謝23基于mean-shift算法的目標跟蹤技術的研究摘要:基于視頻的運動目標跟蹤是計算機視覺研究領域的一項必不可少的關鍵技術。MeanShift算法是眾多優(yōu)秀的運動目標跟蹤算法之一。本文的主要研究內容為MeanSh
3、ift理論和傳統(tǒng)的MeanShift目標跟蹤算法,MeanShift算法采用核顏色直方圖作為描述目標的模型,核函數(shù)的單峰性使得該算法對目標的部分遮擋或目標變形具有較好的魯棒性,并且具有較好的實時性。本文介紹了MeanShift的一些相關理論,如核密度估計理論等,解釋了MeanShift向量的概念,并對MeanShift算法的收斂性進行了證明。在MeanShift理論的基礎上,本文詳細描述了MeanShift應用于目標跟蹤的具體方法和步驟,同時提出了尺度自適應的更新策略,以滿足跟蹤過程中目標尺度的變化要求,還列出了MeanShift算法在各種不同情況下的實驗結果及分析。關鍵詞
4、:MeanShift,密度估計,核函數(shù)第一章緒論1.1課題研究背景及意義人類從外部世界獲得的感官信息中,80%以上是來自于視覺。人們通過視覺能力從外界獲取各種事物的圖像信息,視覺系統(tǒng)將這些信息傳遞給大腦進行處理,產生含義異常豐富的視覺信息,然后大腦再理解這些視覺信息,從而指導人們進行各種相應的活動讓機器人具有視覺是人類的一個夢想,機器擁有人類的視覺功能對世界產生的影響怎么估計大概都不為過。現(xiàn)實世界中的物體都是三維的,而人眼所獲得的景物圖像是二維的,人類的視覺系統(tǒng)能從二維圖像中獲得三維信息,從而感知三維世界。但是讓機器擁有這樣的能力卻是非常困難的事情。隨著信號處理理論的發(fā)展和
5、計算機的出現(xiàn),人們似乎發(fā)現(xiàn)了一條模擬人類視覺的可行之路:用攝像機獲取環(huán)境圖像并轉換成數(shù)字信號,用計算機通過數(shù)字圖像處理的方法模擬人類對視覺信息處理的全過程,這樣,就形成了一門新興的學科—計算機視覺。計算機視覺是一門綜合性和學科交叉性很強的學科,它涉及圖像處理、人工智能、模式識別、人工神經(jīng)網(wǎng)絡和數(shù)學等。其研究目標是使計算機具有通過二維圖像認知三維環(huán)境的能力,這種能力將不僅使機器能夠感知三維環(huán)境中的形狀、位置、姿勢等物體的幾何信息,而且更重要的是能夠對這些信息進行描述、存儲、識別和理解。計算機視覺的研究始于20世紀50年代末,到80年代,計算機視覺的基本研究中取得了重要進展,D
6、avidMarr基于數(shù)學和神經(jīng)科學領域的背景提出了比較完善的計算機視覺理論,首次從信息處理的角度綜合了圖像處理、心理物理學和神經(jīng)生理學等學科的研究成果,提出了第一個較為完善的視覺系統(tǒng)框架。20世紀50年代從統(tǒng)計模式識別開始的,當時的工作主要集中在二維圖像的分析和識別上,如光學字符識別,工件表面、顯微圖片和航空圖片的分析和解釋等。60年代Robesrt(1965)通過計算機程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結構,并對物體形狀及物體的空間關系進行描述。Rboerts的研究工作開創(chuàng)了以理解三維場景為目的的三維計算機視覺的研究。Rboerts對積木世界的
7、創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復雜的三維場景。70年代,已經(jīng)出現(xiàn)了一些視覺應用系統(tǒng)。70年代中期,麻省理工學院(MIT)人工智能A(D實驗室正式開設“計算機視覺,(Maehinevision)課程,由國際著名學者B.K.P.Horn教授講授。同時,MIT^I實驗室吸引了國際上許多知名學者參與計算機視覺的理論、算法和系統(tǒng)設計的研究,DvadiMarr教授就是其中的一位。他于1973年應邀在MTIAI實驗室領導一個以博士生為主體的研究小組,197