資源描述:
《矢量近似索引描述方法在圖像檢索中的應(yīng)用研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、北京交通大學(xué)碩士學(xué)位論文矢量近似索引描述方法在圖像檢索中的應(yīng)用研究姓名:尹鴻峰申請(qǐng)學(xué)位級(jí)別:碩士專(zhuān)業(yè):計(jì)算機(jī)應(yīng)用技術(shù)指導(dǎo)教師:許宏麗20080601中文摘要隨著數(shù)字化、信息化時(shí)代的到來(lái),多媒體信息大量涌現(xiàn),圖像數(shù)據(jù)也隨之飛速增長(zhǎng),在氣象、醫(yī)療、交通和軍事等眾多領(lǐng)域被大量地應(yīng)用。與此同時(shí)如何對(duì)大量的圖像數(shù)據(jù)進(jìn)行快速、有效地檢索,得到用戶所需要的數(shù)據(jù),已經(jīng)成為計(jì)算機(jī)研究領(lǐng)域中急待解決的重要課題之一。在傳統(tǒng)的基于內(nèi)容的圖像檢索系統(tǒng)中,由于圖像視覺(jué)特征(顏色或紋理等)高維屬性的特點(diǎn),以前對(duì)于一維數(shù)據(jù)所提出的索引結(jié)構(gòu)不能夠適應(yīng)高維數(shù)據(jù)的檢索要求,所以
2、人們提出了許多的高維索引算法,如KDB-tree、R-tree及其家族系列等。但人們?cè)趹?yīng)用過(guò)程中發(fā)現(xiàn),以上這些樹(shù)形結(jié)構(gòu)的檢索性能隨著數(shù)據(jù)維度的增高而急劇下降,特別是當(dāng)數(shù)據(jù)的維度超過(guò)lO維時(shí),往往這些算法的效率甚至不如直接使用高維數(shù)據(jù)的順序檢索方法【I】,這種現(xiàn)象也就是我們所說(shuō)的維度災(zāi)難(DimensionCurse)。為了解決這個(gè)問(wèn)題,人們又提出許多相應(yīng)的算法,如VA—File、NB—tree、金字塔算法等。但這些算法也都存在著自身的一些缺陷,如VA—File算法采用了向量近似的方法,通過(guò)近似向量來(lái)構(gòu)建索引,實(shí)現(xiàn)對(duì)高維數(shù)據(jù)的過(guò)濾,是能夠有效
3、解決維度災(zāi)難問(wèn)題的算法之一,但由于該算法所提出的前提是針對(duì)數(shù)據(jù)獨(dú)立分布的情況之下,沒(méi)有考慮現(xiàn)實(shí)數(shù)據(jù)的相關(guān)性(這也是金字塔算法中存在的主要問(wèn)題),另外采用向量近似的方法,數(shù)據(jù)維度沒(méi)有精減,使實(shí)際的數(shù)據(jù)計(jì)算量沒(méi)有得到較大的降低,因而也影響了索引的效率。同樣在NB—tree中雖然實(shí)現(xiàn)了有效降維,但由于沒(méi)有考慮數(shù)據(jù)的空間分布,因此其索引結(jié)點(diǎn)中的冗余節(jié)點(diǎn)較多,進(jìn)而影響其索引效率。在本文中針對(duì)圖像數(shù)據(jù)的高維特性,在對(duì)基于內(nèi)容的圖像檢索技術(shù)所提出的各種不同的索引算法進(jìn)行深入研究的基礎(chǔ)上,吸取許多優(yōu)秀算法的優(yōu)點(diǎn)并進(jìn)行了綜合和改進(jìn),提出了一種較為快捷的檢索方
4、法一一靶標(biāo)式圖像檢索算法。按照數(shù)據(jù)的分布或按數(shù)據(jù)空間進(jìn)行分割是進(jìn)行圖像檢索的兩種很重要的方法,兩者各有其優(yōu)缺點(diǎn)。在本文中綜合這兩種方法的優(yōu)點(diǎn),提出了一種新型的圖像索引算法,通過(guò)對(duì)數(shù)據(jù)空間進(jìn)行劃分,并對(duì)劃分后的子空間賦予不同的代碼值,以此構(gòu)建圖像的索引結(jié)構(gòu)。并在此理論基礎(chǔ)之上,設(shè)計(jì)了一個(gè)基于內(nèi)容的圖像檢索實(shí)驗(yàn)平臺(tái),通過(guò)對(duì)實(shí)驗(yàn)數(shù)據(jù)結(jié)果的比較,證明了作者提出的索引結(jié)構(gòu)在基于內(nèi)容的圖像檢索中的高效和實(shí)用性。關(guān)鍵詞:基于內(nèi)容的圖像檢索;維度災(zāi)難;K■NN;環(huán)形類(lèi);空間編碼分類(lèi)號(hào):j匕塞變通太堂亟±堂僮j金塞△旦墨!B△£!ABSTRACTABSTRA
5、CT:Alongwiththedigitalandinformationage,alargenumberofmulti.mediainformation,includingimagedata,israpidgrowing.Imagedataarewidelyappliedinweather,medical,transportation,militaryandSOonfields.Meanwhile,howtoretrievaltheimageswithrapidandeffectiveways,andshowingtherequiredda
6、tatoclientbecomeanurgencyproblem.Inthetraditionalcontent-basedimageretrievalsystems,becauseoftheimagefeatures(colorortexture,etc.)havehigh-dimensionalnature,theone—dimensionaldata’Sindexstructurecan’tadapttothesedata.Forthisreason,manyalgorithmshavebeenproposed,suchastree-
7、basedindex(KDB—tree,R-tree).However,wefoundtheperformanceofthosetree-basedindexstructuresharplydegradedasdimensionalityincreases,thesealgorithmsevencall’tworkasdirectretrievalwaywhenthedatadimensionabove10.Thisphenomenoniscalledas‘DimensionCurse’.Forthiscause,researchersha
8、veputforwardmanycorrespondingalgorithms,such弱VA—File,NB—tree,pyramidalgorithm.However,the