用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型

用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型

ID:15894753

大小:6.06 MB

頁(yè)數(shù):4頁(yè)

時(shí)間:2018-08-06

用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型_第1頁(yè)
用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型_第2頁(yè)
用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型_第3頁(yè)
用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型_第4頁(yè)
資源描述:

《用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。

1、第38卷第8期2011年8月計(jì)算機(jī)科學(xué)Vol.38NComputerScienceAug20用于圖像場(chǎng)景分類(lèi)的空間視覺(jué)詞袋模型王宇新1郭(大連理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院禾2何昌欽1馮振1,2賈棋2大連116023)1(大連理工大學(xué)軟件學(xué)院大連116620)2摘要以傳統(tǒng)的詞袋模型為基礎(chǔ),根據(jù)同類(lèi)場(chǎng)景圖像具有空間相似性的特點(diǎn),提出了一種用于圖像場(chǎng)景分類(lèi)的空視覺(jué)詞袋模型。首先將圖像進(jìn)行不同等級(jí)的空間劃分,針對(duì)對(duì)應(yīng)空間子區(qū)域進(jìn)行特征提取和k均值聚類(lèi),形成該區(qū)的視覺(jué)關(guān)鍵詞,進(jìn)而構(gòu)建整個(gè)訓(xùn)練圖像集的空間視覺(jué)詞典。進(jìn)行場(chǎng)景識(shí)別時(shí),將所有空間子區(qū)域的視覺(jué)關(guān)鍵詞連接一個(gè)全局特征向量

2、進(jìn)行相似度計(jì)算。最終的場(chǎng)景分類(lèi)結(jié)果使用V1濾波器和PACT?xún)煞N特征在支持向量機(jī)LIBSV上獲得。關(guān)鍵詞場(chǎng)景分類(lèi),詞袋,空間聚類(lèi),空間視覺(jué)詞典,支持向量機(jī)中圖法分類(lèi)號(hào)文獻(xiàn)標(biāo)識(shí)碼TP301ABagofSpatialVisualWordsModelforSceneClassificationWANGYu-xin1GUOHe2HEChang-qin1FENGZhen1,2JIAQi2(SchoolofComputerScienceandTechnology,DalianUniversityofTechnology,Dalian116023,China)1(SchoolofS

3、oftware,DalianUniversityofTechnology,Dalian116620,China)2AbstractAnapproachtorecognizescenecategoriesbymeansofanovelmodelnamedbagofspatialvisualwordswaproposed.Imageswerehierarchicallydividedintosubregionsandthespatialvisualvocabularywasconstructedbgroupingthelow-levelfeaturescollected

4、fromeverycorrespondingspatialsubregionintoaspecifiednumberofclusteusingk-meansalgorithm.Torecognizethecategoryofascene,thevisualvocabularydistributionsofallspatialsubrgionswereconcatenatedtoformaglobalfeaturevector.TheclassificationresultwasobtainedusingLIBSVMandtwkindsoffeatureswereus

5、edintheexperiments:“V1-like”filtersandPACTfeatures.KeywordsSceneclassification,Bagofwords,Spatialclustering,Spatialvisualvocabulary,SVM人類(lèi)視覺(jué)感知的一個(gè)顯著特點(diǎn)是能夠很快掌握一圖像所表達(dá)的含義。MaryPotter通過(guò)實(shí)驗(yàn)證明,僅僅組快速的圖像流,觀察者也能識(shí)別出每一幅圖像的語(yǔ)和一些圖像中的對(duì)象及其屬性[6]。這種通過(guò)快速引言1隨著數(shù)碼設(shè)備的普及和信息存儲(chǔ)與傳輸技術(shù)的快速發(fā)展,圖像數(shù)據(jù)發(fā)生爆炸性增長(zhǎng)。如何用計(jì)算機(jī)對(duì)大量且不斷增加的圖

6、像進(jìn)行分析和理解,成為一項(xiàng)越來(lái)越緊迫的任務(wù)。因此基于內(nèi)容的檢索技術(shù)已成為國(guó)內(nèi)外研究的熱點(diǎn),并成為21世紀(jì)初必須攻克的關(guān)鍵技術(shù)之一[1]。本文將重點(diǎn)關(guān)注圖像場(chǎng)景識(shí)別和分類(lèi)問(wèn)題。傳統(tǒng)的場(chǎng)景分類(lèi)方法通常使用色彩、紋理和形狀等圖像底層視覺(jué)特征直接與監(jiān)督學(xué)習(xí)方法相結(jié)合進(jìn)行圖像場(chǎng)景分類(lèi)[2];或者對(duì)場(chǎng)景中的目標(biāo)進(jìn)行有效的分析,以完成場(chǎng)景的整體識(shí)別,具有代表性的如王濤、胡事民和孫家廣院士提出的基于顏色-空間特征的圖像檢索方法[3];或者采用文本主題模型的方法將圖像分類(lèi)到不同的語(yǔ)義類(lèi)別中:將圖像的局部不變特征聚類(lèi)為一組視覺(jué)詞匯,并用詞袋(Bagofwords)模型來(lái)表示,最后用LD

7、A(LatentDirichletAllocation)[4]或PLSA(ProbabilisticLatentSmanticAnalysis)[5]等主題分析模型找出圖像的潛在語(yǔ)義和最可能屬于的主題,從而完成場(chǎng)景分類(lèi)。200ms)觀察圖像所獲得的視覺(jué)和語(yǔ)義信息稱(chēng)為圖[7]。在拍攝照片時(shí),攝影師總是盡可能把能反映圖gist或者語(yǔ)義的對(duì)象和特征顯示在圖像中心。這一拍攝習(xí)大多數(shù)針對(duì)同類(lèi)目標(biāo)的圖像都有相同的拍攝角度,即像具有空間相似度。例如,許多城市的圖像是這樣一種高樓下面連接著人行橫道,而頂上是藍(lán)天;高速公路是大的平面向水平線方向延伸,期間充滿(mǎn)了一些凹凸。這果我們把

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。