資源描述:
《基于隨機游走的圖像多樣性搜索重排序算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、天津大學(xué)碩士學(xué)位論文基于隨機游走的圖像多樣性搜索重排序算法研究ResearchonImageDiversitySearchRerankingBasedonRandomWalkModel學(xué)科專業(yè):信息與通信工程研究生:李靖指導(dǎo)教師:張靜副教授天津大學(xué)電子信息工程學(xué)院二零一二年十一月獨創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進行的研究工作和取得的研究成果,除了文中特別加以標(biāo)注和致謝之處外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得天津大學(xué)或其他教育機構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。學(xué)位論文作
2、者簽名:簽字日期:年月日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解天津大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定。特授權(quán)天津大學(xué)可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行搜索,并采用影印、縮印或掃描等復(fù)制手段保存、匯編以供查閱和借閱。同意學(xué)校向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和磁盤。(保密的學(xué)位論文在解密后適用本授權(quán)說明)學(xué)位論文作者簽名:導(dǎo)師簽名:簽字日期:年月日簽字日期:年月日中文摘要近些年來隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)上出現(xiàn)的數(shù)據(jù)呈現(xiàn)出爆炸式的增長,特別是圖像數(shù)據(jù)。圖像具有直觀、生動的特性,且與人類生活息息相關(guān),因此如何能夠準(zhǔn)確地獲取所需圖像信息是當(dāng)前多媒體搜索領(lǐng)域需要重點解決的問題。目前主
3、流的搜索引擎主要是依靠圖像的標(biāo)題、描述等元數(shù)據(jù)信息進行基于文字信息的圖像搜索,并沒有利用圖像的視覺特性,因此搜索結(jié)果并不理想。為了使結(jié)果更加符合用戶的需求,圖像搜索重排序算法被提出應(yīng)用于圖像搜索領(lǐng)域。該技術(shù)是指在原始文本搜索的基礎(chǔ)之上,再次結(jié)合圖像本身的信息對原始的重排序結(jié)果進行重新重排序,以提高用戶的搜索體驗。目前的大多工作圍繞圖像的相關(guān)性搜索重排序展開,對多樣性搜索重排序的研究較少。相關(guān)性重排序是指對于返回結(jié)果來說,都是將相關(guān)的樣本排在結(jié)果集的前列,但是很少考慮樣本相互之間的聯(lián)系,而多樣性重排序是為了提高返回結(jié)果的多樣性,也就是覆蓋主題的多樣性,以降低相關(guān)重排序中帶來的信息冗余問題。本文
4、主要利用隨機游走模型實現(xiàn)圖像搜索的多樣性重排序。具體工作如下:1)實現(xiàn)了基于圖像的搜索相關(guān)性重排序算法,能夠使產(chǎn)生的結(jié)果按照相關(guān)性進行重排序。2)提出了基于DivRank算法的圖像多樣性重排序算法。DivRank是自定義的隨機游走模型,通過引入訪問次數(shù)隨時間增長的馬爾科夫數(shù)學(xué)模型來完成多樣性重排,能夠有效的降低搜索結(jié)果之間的冗余信息。為此,我們將其應(yīng)用于圖像領(lǐng)域并提出相應(yīng)的GDRID算法。3)提出了基于DDRank的圖像多樣性重排序算法。DDRank是基于DivRank算法的改進,它通過修改初始重排序的權(quán)值來降低DivRank所帶來的永久破壞原始信息網(wǎng)絡(luò)結(jié)構(gòu)的副作用,能夠在保證多樣性的基礎(chǔ)上
5、兼顧相關(guān)性。為此,我們將其應(yīng)用在圖像領(lǐng)域并提出相應(yīng)的DIR算法。通過在MSRA_V-1.0等數(shù)據(jù)庫上的大規(guī)模實驗,表明所提GDRID和DIR算法能夠在有效保持圖像搜索相關(guān)性的前提下,提高多樣性性能。關(guān)鍵詞:圖像搜索重排序多樣性搜索重排序隨機游走基于內(nèi)容的圖像搜索ABSTRACTWiththedevelopmentoftheinternetinrecentyears,themultimediadataespeciallytheimagesandvideosareexplosivelygrowing.Visualresourceshavesomeunmatchablefeatureslikein
6、tuitiveandvivid.Mostofpeopleareindispensabletotheseresources.Therefore,howtocorrectlyretrievevisualresourcesisthemostconcerntoallsearchengines.However,mainstreamsearchenginesusetextretrievalusuallybasedonthetitleoftheimageorthedescriptionmeta-dataratherthanvisualinformationoftheimageitself,sothatth
7、esearchingresultsarenotideal.ImageRerankingalgorithmshavebeenproposedinordertomakeinlinewiththeneedoftheusers.Rerankingisgenerallyusingtheinformationoftheimageitselftoreordertheoriginalresultinordertoimprov