資源描述:
《基于內(nèi)容的視頻檢索算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、武漢理工大學(xué)碩士學(xué)位論文基于內(nèi)容的視頻檢索算法研究姓名:任曉峰申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):通信與信息系統(tǒng)指導(dǎo)教師:吳巍20080401武漢理工大學(xué)碩士學(xué)位論文摘要目前隨著多媒體和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,海量的視頻信息不斷涌現(xiàn),使得有效地對(duì)視頻的分析和檢索的要求日益重要。為此,在信息學(xué)科形成了一個(gè)全新的研究領(lǐng)域,即基于內(nèi)容的視頻檢索(Content.BasedVideoretrieval,CBVR)技術(shù)。CBVR是指在視頻分析的基礎(chǔ)上,提取能夠反映視頻內(nèi)容的各種特征,進(jìn)而通過模式匹配從海量視頻數(shù)據(jù)庫(kù)中檢索出相關(guān)的視頻流。視頻的內(nèi)容包括視頻的
2、結(jié)構(gòu)信息、低層次的視覺和聽覺信息以及高級(jí)語義信息,所有這些都是后續(xù)理解和分析的基礎(chǔ)。本文主要研究了視頻時(shí)域分割問題,將整個(gè)視頻劃分為若干級(jí)的層次結(jié)構(gòu):場(chǎng)景、鏡頭、關(guān)鍵幀等。鏡頭分割是基于內(nèi)容的視頻檢索中最基本也是最重要的一項(xiàng)內(nèi)容,它的基本任務(wù)是根據(jù)相鄰幀圖像的相關(guān)性將視頻序列分割成相對(duì)獨(dú)立的基本單元一鏡頭,其精度直接影響到視頻檢索的成敗與精度,能準(zhǔn)確、快速分割出鏡頭,對(duì)視頻分析和檢索具有重要的影響。鏡頭分割分為壓縮域和非壓縮域兩類,而鏡頭變換類型大致分為突變和漸變,其中漸變由于不同的視頻剪輯方法具有多種表現(xiàn)形式。本文的主要工作有:
3、(1)介紹了基于內(nèi)容視頻檢索系統(tǒng)的主要技術(shù)及特點(diǎn),著重介紹了基于內(nèi)容的視頻數(shù)據(jù)模型以及通用的視頻結(jié)構(gòu)化數(shù)據(jù)模型。(2)介紹了像素域和壓縮域中的鏡頭分割方法。在像素域中傳統(tǒng)的變步長(zhǎng)鏡頭分割算法的基礎(chǔ)上,本文提出了一種改進(jìn)的變步長(zhǎng)鏡頭分割算法,即檢測(cè)突變的方法不變,在檢測(cè)漸變的過程中融入雙向閥值法。在鏡頭的表達(dá)方面,本文介紹了目前的幾種關(guān)鍵幀提取的方法,并給出了對(duì)關(guān)鍵幀提取結(jié)果的評(píng)價(jià)準(zhǔn)則。(3)在鏡頭分割和關(guān)鍵幀提取的基礎(chǔ)上,本文進(jìn)一步研究了基于鏡頭聚類的場(chǎng)景分割方法。在基于鏡頭邊界的聚類算法基礎(chǔ)上,提出了利用鏡頭幀圖像的全局顏色特征
4、和運(yùn)動(dòng)特征來分割場(chǎng)景的方法。并利用VisualC++6.O實(shí)現(xiàn)了一個(gè)簡(jiǎn)單的視頻檢索系統(tǒng)。關(guān)鍵詞:基于內(nèi)容的視頻檢索;鏡頭分割;鏡頭聚類武漢理工大學(xué)碩士學(xué)位論文AbstractWiththerapiddevelopmentofmultimediaandnetworktechnique,efficientandeffectivevideoanalysisandretrievalbecomemoreandmoreimportantduetoteemingofvastvideoinformation.Hence,itcomesfortha
5、newresearchfieldintheinformationtechnology,i.e.Content—BasedVideoRetrieval(CBVR).CBVRmeansvideoretrievalfromenormousvideodatabasethroughmatchingofpatternsfromvideoanalysisandfeatureextractiontorepresentitscontent.Inavideo,thecontentsincludeitsstructure,lOW.1evelvisual
6、andauralfeatures,andhigh-levelsemanticinformation,whichformthebaseforfurthervideocomprehendandanalysis.Themainworkinthisthesisisvideotemporalsegmentation,eachvideosequencecouldbehierarchicallysegmentedas"Scenes,shotsandkeyframes.Shotdetectionisthemostfundamentaloperat
7、ionandveryimportantstepinCBVR.Shotdetectionisatechniquethatdividesvideodataintophysicalunits,generallycalledshots.Sotheaccuracyandexecutionspeedofshotdetectioniscritical.ApproachestoshotsegmentationCanbeclassifiedasthosethatoperateinMPEGcompresseddomainandthoseinuncom
8、presseddomain,shotchangeCanbeclassifiedabruptchangeandgradualchange.Themaintasksofthispaperare"(1)Introducingthemaintechnica