資源描述:
《基于tld框架的多目標(biāo)視覺跟蹤算法的研究與應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、學(xué)校代碼:10255學(xué)號:2151533基于TLD框架的多目標(biāo)視覺跟蹤算法的研究與應(yīng)用ARobustMulti-targetVisualTrackingMethodusingTLDFramework學(xué)科專業(yè):計算機(jī)科學(xué)與技術(shù)作者:楊震指導(dǎo)教師:黃永鋒答辯日期:2018年5月東華大學(xué)DonghuaUniversity東華大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:我恪守學(xué)術(shù)道德,崇尚嚴(yán)謹(jǐn)學(xué)風(fēng)。所呈交的學(xué)位論文,是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的成果。除文中已明確注明和引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫過的作品及成果的內(nèi)容。論文為本人親自撰寫,我對所寫的內(nèi)容負(fù)
2、責(zé),并完全意識到本聲明的法律結(jié)果由本人承擔(dān)。學(xué)位論文作者簽名:日期:年月日東華大學(xué)學(xué)位論文版權(quán)使用授權(quán)書學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱或借閱。本人授權(quán)東華大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。保密□,在年解密后適用本版權(quán)書。本學(xué)位論文屬于不保密□。學(xué)位論文作者簽名:指導(dǎo)教師簽名:日期:年月日日期:年月日東華大學(xué)碩士學(xué)位論文答辯委員會成員名單姓名職稱職務(wù)工作單位備注樂嘉錦教授答辯委員會主席東華大學(xué)潘喬副教授答辯委
3、員會秘書東華大學(xué)朱立峰教授級高工答辯委員會委員瑞金醫(yī)院王梅教授答辯委員會委員東華大學(xué)陳德華副教授答辯委員會委員東華大學(xué)李悅講師答辯委員會委員東華大學(xué)基于TLD框架的多目標(biāo)視覺跟蹤算法的研究與應(yīng)用摘要21世紀(jì)以來,隨著人工智能以及物聯(lián)網(wǎng)的飛速發(fā)展,作為計算機(jī)直接獲取自然界信息的最主要途徑,計算機(jī)視覺領(lǐng)域的研究再一次成為熱點(diǎn),而視覺跟蹤正是該領(lǐng)域的主要研究方向之一。目前最熱門的視覺跟蹤算法是通過檢測算法提高跟蹤效果,在估計目標(biāo)位置的同時,調(diào)整目標(biāo)模型的參數(shù)。ZdenekKalal在2012年提出了一種單目標(biāo)長時間跟蹤算法——TLD算法。與傳統(tǒng)跟蹤算法最大的區(qū)別是,該算法通過結(jié)合傳統(tǒng)檢測算
4、法與傳統(tǒng)跟蹤算法,以半監(jiān)督學(xué)習(xí)的方式,在跟蹤過程中通過學(xué)習(xí)不斷更新運(yùn)動目標(biāo)模型,解決運(yùn)動目標(biāo)在運(yùn)動過程中發(fā)生形變、部分遮擋時可能會造成跟蹤失敗的問題,使運(yùn)動目標(biāo)跟蹤系統(tǒng)更加穩(wěn)定、魯棒、可靠。但是,該算法也有一些局限性。比如,由于該算法需要從視頻序列中通過手動選取的方式,標(biāo)記待跟蹤目標(biāo),無法自動識別以及跟蹤預(yù)先設(shè)定的目標(biāo);與此同時,由于該算法是基于LK光流法,因此對跟蹤目標(biāo)的形變以及旋轉(zhuǎn)等情況較為敏感。本文創(chuàng)新性地在經(jīng)典TLD算法的基礎(chǔ)上,提出了一種新的多目標(biāo)視覺跟蹤算法。主要的成果和結(jié)論如下:(1)針對原TLD框架在線更新模板庫時會產(chǎn)生累計誤差的問題,提出一種改進(jìn)的級聯(lián)分類器代替原有
5、的檢測器算法。(2)針對原TLD框架對跟蹤目標(biāo)在運(yùn)動過程中的形變與旋轉(zhuǎn)較為敏感的問題,在原有框架結(jié)構(gòu)基礎(chǔ)上,增加一個新的輔助檢測器,提高算法的魯棒性。(3)針對原TLD框架僅能對單一目標(biāo)進(jìn)行跟蹤的問題,采用無類別跟蹤策略,將每個目標(biāo)視為獨(dú)立的個體,采取并行處理視頻的方式,實(shí)現(xiàn)同時對多個目標(biāo)進(jìn)行跟蹤。通過對算法框架的重新設(shè)計以及改進(jìn),實(shí)現(xiàn)了基于TLD算法的I多目標(biāo)跟蹤系統(tǒng)。經(jīng)過多次實(shí)驗(yàn)證明,該算法在不影響系統(tǒng)效率的情況下,不僅依然可以應(yīng)對運(yùn)動目標(biāo)運(yùn)動過程中發(fā)生部分遮擋、短暫消失等問題,對運(yùn)動目標(biāo)可能發(fā)生的形變、旋轉(zhuǎn)等問題也有較強(qiáng)的魯棒性。關(guān)鍵詞:TLD;視覺跟蹤;多目標(biāo);半監(jiān)督學(xué)習(xí)II
6、AROBUSTMULTI-TARGETVISUALTRACKINGMETHODUSINGTLDFRAMEWORKABSTRACTInthe21stcentury,withtherapiddevelopmentofartificialintelligenceandInternetifThings,asthemostimportantwayforcomputerstoaccesstheinformationofnaturedirectly,theresearchincomputervisionareahasbecomeahotspotonceagain.Visualtrackingiso
7、neofthemainresearchdirectionsinthisfield.Today’sstate-of-the-artmethodsforvisualtrackingistoimprovetrackingbydetection.Itestimatesthepositionofanobjectandadjusttheparametersofobject’smodel.ZdenekKalalputforwardanewsingle-targetlon