資源描述:
《圖像顯著區(qū)域提取及其在圖像檢索中應用》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、上海交通大學碩士論文摘要圖像顯著區(qū)域提取及其在圖像檢索中的應用摘要隨著信息技術的發(fā)展,圖像成為一種主要的信息載體。越來越多的圖像數據給人工處理和瀏覽造成了不便。在圖像分析與理解中,顯著區(qū)域通常僅是圖像中的一小部分。所謂顯著區(qū)域,也可以理解為圖像中的主要目標,是人的視覺能夠在很短的時間內將注意力集中到圖像中某個能激發(fā)人們興趣的區(qū)域。本文通過對圖像中亮度、色彩、和方向信息的綜合分析,以模擬人類的視覺原理來提取圖像中的顯著區(qū)域。圖像檢索技術是在海量圖像數據庫中查找用戶所需要的圖像或者滿足用戶需求的圖像,目前很多圖像檢索工具都是建立在與圖像相關的文字信息的基礎上,需要大量人為標注,而基于內
2、容的圖像檢索技術從圖像內容本身進行分析,根據圖像特征找出相關圖像,是一種適合于大量圖像數據的檢索手段。圖像檢索中,由于圖像背景通常占據圖像的較大部分,在提取圖像特征的過程中,對圖像中主要目標的特征造成了一定影響。本文在提取圖像顯著區(qū)域之后再進行圖像檢索,從圖像的顯著區(qū)域入手,該方法更加有利于基于內容的圖像檢索。本文以視覺注意的計算模型為出發(fā)點,闡述顯著區(qū)域的提取和圖像檢索技術,主要研究成果如下:-I-上海交通大學碩士論文摘要(1)顯著區(qū)域的提取:該算法基于人類視覺原理,將圖像分解為亮度、顏色和方向三個特征,對每一特征建立多分辨率高斯金字塔,獲得相應的圖像序列,再利用中央-周邊(Ce
3、nter-Surround)算子,分別計算其顯著映射圖,最后,使用動態(tài)權值的方法將各顯著圖結合起來,得到綜合顯著圖,對顯著圖閾值化,將顯著圖中的點分為顯著點和非顯著點,對顯著點構成的區(qū)域進行圖像的開運算和閉運算去掉噪聲點,得到的區(qū)域即為圖像的顯著區(qū)域。對視覺中注意機制、多尺度分析進行了論述,并對相應的算法進行了比較分析。(2)基于內容的圖像檢索:討論了基于內容的圖像檢索的特征提取與相似性度量的方法。先將彩色圖像轉換到HSV空間,提取圖像的顏色特征;使用sobel算子獲得圖像的邊緣信息,計算圖像的邊緣方向變化直方圖,提取圖像的形狀特征;利用Gabor濾波器提取圖像的紋理特征;用直方圖
4、相交法對圖像進行相似性度量,按照計算獲得的圖像相似度,排序檢索結果。(3)將圖像顯著區(qū)域提取用于圖像檢索,直接從圖像的主題內容入手,以獲得更好的檢索結果。對比了基于提取顯著區(qū)域的檢索和直接檢索的差異,提取顯著區(qū)域有利于提高檢索的查準率。對算法中存在的問題進行了討論和分析。-II-上海交通大學碩士論文摘要關鍵詞顯著區(qū)域,圖像特征,視覺注意,金字塔結構,圖像檢索,Gabor濾波-III-上海交通大學碩士論文ABSTRACTEXTRACTIONOFSALIENTREGIONINIMAGEANDAPPLICATIONINCONTENTBASEDIMAGERETRIEVALABSTRACTW
5、iththedevelopmentofinformationtechnology,imagesbecomeamajorcarrierofinformation.Butmoreandmoreimagedatacauseinconvenienceinmanualprocessingandbrowsing.Inimageanalysisandunderstanding,thesalientregionisusuallyonlyasmallpartofanimage.Herethesalientregioncanberegardedasthemainobjectinanimage,whic
6、histheinterestingregionthathumanvisioncanquicklyfocuson.Inthethesis,basedonacomprehensiveanalysisonthegray-scaleinformation,colorinformation,andorientationinformationofanimage,weproposeanapproachtosimulatetheprinciplesofhumanvisiontoextractthesalientregioninanimage.Theimageretrievaltechniquere
7、ferstofindinginterestingordesiredimagesinVLIDBMS(VeryLargeImageDatabaseManagementSystem).Currently,manyimageretrievaltoolsarebasedontextualinformationrelatedtoimagesandrequirealargeamountofhumanlabeling.CBIR(Content-basedimageretrieval)