資源描述:
《圖像挖掘在圖像檢索中的應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中國科學(xué)技術(shù)大學(xué)博士學(xué)位論文圖像挖掘在圖像檢索中的應(yīng)用姓名:段曼妮申請學(xué)位級別:博士專業(yè):信號與信息處理指導(dǎo)教師:吳秀清;徐守時20090701摘要近年來,隨著多媒體技術(shù)和計算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,全世界的數(shù)字圖像的容量正以驚人的速度增長。無論是軍用還是民用設(shè)備,每天都會產(chǎn)生容量相當(dāng)于數(shù)千兆字節(jié)的圖像。這些圖像中包含了現(xiàn)實世界的各種實體,實體所組成的圖像集合則包含著這些實體的變化、相互關(guān)系以及隱藏在其中的各種模式、演化規(guī)律等信息。但是,對于人來說,處理包含數(shù)以萬計的圖像數(shù)據(jù)集,并從中發(fā)現(xiàn)知識,是非常困難,甚至是不可能的。數(shù)據(jù)挖掘
2、、信息檢索和多媒體數(shù)據(jù)庫及其相關(guān)領(lǐng)域的發(fā)展使得對圖像的管理和分析以及從中發(fā)現(xiàn)對人們有用的信息成為可能,同時也促生了圖像挖掘這一研究領(lǐng)域。圖像挖掘指的是在圖像數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、未知而且潛在有用的知識、圖像數(shù)據(jù)關(guān)系的過程。由于這些隱含的信息和知識是人們直觀所不能得到的,它有望使很多相關(guān)領(lǐng)域發(fā)展到一個新的階段。本文的主要研究目的是探索圖像挖掘技術(shù)在圖像檢索領(lǐng)域的應(yīng)用方法。圖像檢索技術(shù)大體上可以分為基于樣例的圖像檢索和基于文字的圖像檢索兩類?;跇永膱D象檢索可分為圖像類別檢索和近重復(fù)圖像檢索兩類:而基于文字的圖象檢索則可分為基于
3、伴生文字和基于圖像自動標(biāo)注兩類。本文對圖像挖掘技術(shù)進(jìn)行了深入研究,主要工作和創(chuàng)新之處歸納為以下幾點(diǎn):1.本文的第二章首先分析了基于Bag—of-Words模型的近重復(fù)檢索中存在的主要問題,即視覺多義詞和同義詞現(xiàn)象,提出用關(guān)聯(lián)規(guī)則挖掘算法挖掘視覺詞組以消除視覺多義詞和同義詞現(xiàn)象的方法。本章使用以特征為中心的事務(wù)庫構(gòu)造方法,并用傳統(tǒng)的Apriori算法在事務(wù)庫挖掘關(guān)聯(lián)視覺詞匯,構(gòu)造視覺詞組。本章同時比較了視覺詞組的多種使用方法,討論了視覺詞組在近重復(fù)圖像檢索中的意義。在標(biāo)準(zhǔn)數(shù)據(jù)庫上的實驗證明了該方法的有效性。2.本文的第三章研究
4、了圖像挖掘技術(shù)在基于伴生文字的圖象檢索中的應(yīng)用。在基于文字的圖像檢索中,利用伴生文字進(jìn)行圖像檢索是當(dāng)今商業(yè)搜索引擎最常用的做法。但是由于伴生信息往往含有較多的噪聲圖像檢索結(jié)果并不能很好地滿足用戶的需求。本文的第三章設(shè)計一個收集用戶知識的網(wǎng)絡(luò)游戲,并通過位置關(guān)聯(lián)規(guī)則挖掘算法分析用戶的游戲日志,獲取的知識用以改善LiveSearch上的地理相關(guān)圖像檢索結(jié)果。大規(guī)模的用戶調(diào)查證實了該方法可以較好地改善基于伴生文字的圖像檢索。I摘要3.本文的第四章提出一種用概念挖掘?qū)崿F(xiàn)風(fēng)格化的圖象自動標(biāo)注的方法。自動圖像標(biāo)注是指通過機(jī)器學(xué)習(xí)的手段,
5、系統(tǒng)自動為圖像生成與內(nèi)容相關(guān)的標(biāo)注詞的過程。該領(lǐng)域中的關(guān)鍵問題是底層特征與高層語義之間的語義鴻溝問題。本章提出,利用概念挖掘,發(fā)現(xiàn)圖像中包含的概念,以及不同用戶的圖像風(fēng)格,從而通過個性化的圖像標(biāo)注方法改善圖像標(biāo)注的結(jié)果。本章提出用PLSA模型對圖像的內(nèi)容以及用戶的興趣進(jìn)行概念挖掘,不同用戶的不同風(fēng)格則被表現(xiàn)為給定概念上的圖像特征和標(biāo)注特征的不同分布。在來自商用網(wǎng)站的數(shù)據(jù)集上的實驗證明,風(fēng)格化的圖像標(biāo)注可以大幅度提高自動圖像標(biāo)注的精度,從而為個性化的圖像檢索提供可能的解決方案。關(guān)鍵詞:圖像檢索,圖像挖掘,近重復(fù)圖像檢索,基于地
6、點(diǎn)的圖像檢索,自動圖像標(biāo)注IIABSTRACTAdvancesinimageacquisitionandstoragetechnologyhaveledtotremendousgrowthinverylargeanddetailedimagedatabases.Theseimages,ifanalyzed,canrevealusefulinformationtothehumanusers.Imageminingdealswiththeextractionofimplicitknowledge,imagedatarelatio
7、nship,orotherpatternsnotexplicitlystoredintheimages.Imageminingisrapidlygainingattentionamongresearchersinthefieldofdatamining,informationretrieval,andmultimediadatabasesbecauseofitspotentialindis—coveringusefulimagepatternsthatmaypushthevariousresearchfieldstonewf
8、ron·tiers.Themainpurposeofthispaperistoexploretheusageofimageminingtechniqueinthefieldofimageretrieval.Imageretrievalingeneralcanbedividedintoexa