資源描述:
《基于視頻的人體動作識別研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、單位代碼:10293密級:專業(yè)學(xué)位碩士論文論文題目:基于視頻的人體動作識別研究學(xué)號1210063023姓名王培培導(dǎo)師王保云教授專業(yè)學(xué)位類別工學(xué)碩士類申請型全日制專業(yè)申請(領(lǐng)域)控制工程論文提交日期二○一三年三月Video-basedHumanActionRecognitionThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByWangPeipeiSupervisor:Prof.WangBaoyunMarch2013南京郵電大學(xué)學(xué)位論文原創(chuàng)性聲明
2、本人聲明所呈交的學(xué)位論文是我個人在導(dǎo)師指導(dǎo)下進行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得南京郵電大學(xué)或其它教育機構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。本人學(xué)位論文及涉及相關(guān)資料若有不實,愿意承擔(dān)一切相關(guān)的法律責(zé)任。研究生簽名:_____________日期:____________南京郵電大學(xué)學(xué)位論文使用授權(quán)聲明本人授權(quán)南京郵電大學(xué)可以保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子文檔;允許論文被查閱和借閱;可以將學(xué)位
3、論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索;可以采用影印、縮印或掃描等復(fù)制手段保存、匯編本學(xué)位論文。本文電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。論文的公布(包括刊登)授權(quán)南京郵電大學(xué)研究生院辦理。涉密學(xué)位論文在解密后適用本授權(quán)書。研究生簽名:____________導(dǎo)師簽名:____________日期:_____________摘要人體運動分析是計算機視覺研究中的一個重要領(lǐng)域,人體動作行為識別更是該領(lǐng)域中的一個備受關(guān)注和極具挑戰(zhàn)性的課題。人體動作行為識別技術(shù)在許多領(lǐng)域中都有廣泛的應(yīng)用,如:智能視頻監(jiān)控、虛擬現(xiàn)實、人機交互、體育及娛樂運動分析等。本文的主要研究內(nèi)容如下:本文從多特征融合
4、的思想出發(fā),旨在找到一種既包含目標人體運動信息,又具備人體外形特征的優(yōu)良特征描述符。光流方向直方圖(HistogramsofOrientedOpticalFlow,HOOF)用來描述視頻中特定圖像幀的運動特征,而方向梯度直方圖(HistogramofOrientedGradient,HOG)則可以用來獲取人體結(jié)構(gòu)外觀信息,本文將這兩種特征進行一種加權(quán)融合,從而得到一種基于多特征融合的優(yōu)良特征描述符,即加權(quán)光流方向直方圖(HistogramofWeightedOpticalFlow,HOWOF)。這個特征描述符不僅包含了人體動作行為中的運動特征,同時也融合了人體動作運動過程中的外形特征
5、。因此,它是一個良好的特征描述子,為后續(xù)過程中人體動作行為的分類識別奠定了良好的基礎(chǔ)。本文主要采用線性動態(tài)系統(tǒng)(LinearDynamicSystem,LDS)為動態(tài)場景進行建模,然后采用距離測量法對這些線性動態(tài)系統(tǒng)進行相似度測量并對其進行分類,如,比奈-柯西核(Binet-CauchyKernel)等距離測量。然而這種方法只適用于歐式空間中的時間序列數(shù)據(jù),比如,從運動捕捉數(shù)據(jù)中提取的聯(lián)合軌跡,或者是從視頻中提取的特征點軌跡等。然而,一些復(fù)雜的特征描述子,比如尺度不變特征變換匹配算法(ScaleInvariantFeatureTransformation,SIFT)描述子、HOG描述
6、子等,它們本質(zhì)上都是直方圖,而直方圖是非歐式空間中的數(shù)據(jù),所以就不能使用線性動態(tài)系統(tǒng)為這些隨時間變化的描述符建立模型,同樣也不能使用線性動態(tài)系統(tǒng)中的距離測量方法進行分類。因此,本文將Binet-Cauchy核推廣到輸出數(shù)據(jù)為非歐式空間數(shù)據(jù)(如直方圖空間)的非線性動態(tài)系統(tǒng)(Non-LinearDynamicSystem,NLDS)中,使用核距離測量的方法對視頻序列進行分類識別。關(guān)鍵詞:人體動作識別,光流方向直方圖,加權(quán)光流方向直方圖,非線性動態(tài)系統(tǒng),核主成分分析,相似度測量,留一逼近交叉驗證法IAbstractAnalysisofhumanactivitieshasalwaysrema
7、inedatopicofgreatinterestincomputervision,andhumanactionrecognitionisachallengingresearchtopicinthisfield.Humanactionrecognitioniscriticalforawiderangeofapplications,suchasvideosurveillance,man-machineinterface,digitalentertainmen