用于圖像場景分類的空間視覺詞袋模型

ID：15894753

大?。?.06 MB

頁數(shù)：4頁

時間：2018-08-06

資源描述：

《用于圖像場景分類的空間視覺詞袋模型》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、第３８卷第８期２０１１年８月計算機科學Ｖｏｌ．３８ＮＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅＡｕｇ２０用于圖像場景分類的空間視覺詞袋模型王宇新１郭（大連理工大學計算機科學與技術(shù)學院禾２何昌欽１馮振１，２賈棋２大連１１６０２３）１（大連理工大學軟件學院大連１１６６２０）２摘要以傳統(tǒng)的詞袋模型為基礎(chǔ)，根據(jù)同類場景圖像具有空間相似性的特點，提出了一種用于圖像場景分類的空視覺詞袋模型。首先將圖像進行不同等級的空間劃分，針對對應(yīng)空間子區(qū)域進行特征提取和ｋ均值聚類，形成該區(qū)的視覺關(guān)鍵詞，進而構(gòu)建整個訓練圖像集的空間視覺詞典。進行場景識別時，將所有空間子區(qū)域的視覺關(guān)鍵詞連接一個全局特征向量

2、進行相似度計算。最終的場景分類結(jié)果使用Ｖ１濾波器和ＰＡＣＴ兩種特征在支持向量機ＬＩＢＳＶ上獲得。關(guān)鍵詞場景分類，詞袋，空間聚類，空間視覺詞典，支持向量機中圖法分類號文獻標識碼ＴＰ３０１ＡＢａｇｏｆＳｐａｔｉａｌＶｉｓｕａｌＷｏｒｄｓＭｏｄｅｌｆｏｒＳｃｅｎｅＣｌａｓｓｉｆｉｃａｔｉｏｎＷＡＮＧＹｕ－ｘｉｎ１ＧＵＯＨｅ２ＨＥＣｈａｎｇ－ｑｉｎ１ＦＥＮＧＺｈｅｎ１，２ＪＩＡＱｉ２（ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，ＤａｌｉａｎＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，Ｄａｌｉａｎ１１６０２３，Ｃｈｉｎａ）１（ＳｃｈｏｏｌｏｆＳ

3、ｏｆｔｗａｒｅ，ＤａｌｉａｎＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ，Ｄａｌｉａｎ１１６６２０，Ｃｈｉｎａ）２ＡｂｓｔｒａｃｔＡｎａｐｐｒｏａｃｈｔｏｒｅｃｏｇｎｉｚｅｓｃｅｎｅｃａｔｅｇｏｒｉｅｓｂｙｍｅａｎｓｏｆａｎｏｖｅｌｍｏｄｅｌｎａｍｅｄｂａｇｏｆｓｐａｔｉａｌｖｉｓｕａｌｗｏｒｄｓｗａｐｒｏｐｏｓｅｄ．Ｉｍａｇｅｓｗｅｒｅｈｉｅｒａｒｃｈｉｃａｌｌｙｄｉｖｉｄｅｄｉｎｔｏｓｕｂｒｅｇｉｏｎｓａｎｄｔｈｅｓｐａｔｉａｌｖｉｓｕａｌｖｏｃａｂｕｌａｒｙｗａｓｃｏｎｓｔｒｕｃｔｅｄｂｇｒｏｕｐｉｎｇｔｈｅｌｏｗ－ｌｅｖｅｌｆｅａｔｕｒｅｓｃｏｌｌｅｃｔｅｄ

4、ｆｒｏｍｅｖｅｒｙｃｏｒｒｅｓｐｏｎｄｉｎｇｓｐａｔｉａｌｓｕｂｒｅｇｉｏｎｉｎｔｏａｓｐｅｃｉｆｉｅｄｎｕｍｂｅｒｏｆｃｌｕｓｔｅｕｓｉｎｇｋ－ｍｅａｎｓａｌｇｏｒｉｔｈｍ．Ｔｏｒｅｃｏｇｎｉｚｅｔｈｅｃａｔｅｇｏｒｙｏｆａｓｃｅｎｅ，ｔｈｅｖｉｓｕａｌｖｏｃａｂｕｌａｒｙｄｉｓｔｒｉｂｕｔｉｏｎｓｏｆａｌｌｓｐａｔｉａｌｓｕｂｒｇｉｏｎｓｗｅｒｅｃｏｎｃａｔｅｎａｔｅｄｔｏｆｏｒｍａｇｌｏｂａｌｆｅａｔｕｒｅｖｅｃｔｏｒ．ＴｈｅｃｌａｓｓｉｆｉｃａｔｉｏｎｒｅｓｕｌｔｗａｓｏｂｔａｉｎｅｄｕｓｉｎｇＬＩＢＳＶＭａｎｄｔｗｋｉｎｄｓｏｆｆｅａｔｕｒｅｓｗｅｒｅｕｓ

5、ｅｄｉｎｔｈｅｅｘｐｅｒｉｍｅｎｔｓ：“Ｖ１－ｌｉｋｅ”ｆｉｌｔｅｒｓａｎｄＰＡＣＴｆｅａｔｕｒｅｓ．ＫｅｙｗｏｒｄｓＳｃｅｎｅｃｌａｓｓｉｆｉｃａｔｉｏｎ，Ｂａｇｏｆｗｏｒｄｓ，Ｓｐａｔｉａｌｃｌｕｓｔｅｒｉｎｇ，Ｓｐａｔｉａｌｖｉｓｕａｌｖｏｃａｂｕｌａｒｙ，ＳＶＭ人類視覺感知的一個顯著特點是能夠很快掌握一圖像所表達的含義。ＭａｒｙＰｏｔｔｅｒ通過實驗證明，僅僅組快速的圖像流，觀察者也能識別出每一幅圖像的語和一些圖像中的對象及其屬性［６］。這種通過快速引言１隨著數(shù)碼設(shè)備的普及和信息存儲與傳輸技術(shù)的快速發(fā)展，圖像數(shù)據(jù)發(fā)生爆炸性增長。如何用計算機對大量且不斷增加的圖

6、像進行分析和理解，成為一項越來越緊迫的任務(wù)。因此基于內(nèi)容的檢索技術(shù)已成為國內(nèi)外研究的熱點，并成為２１世紀初必須攻克的關(guān)鍵技術(shù)之一［１］。本文將重點關(guān)注圖像場景識別和分類問題。傳統(tǒng)的場景分類方法通常使用色彩、紋理和形狀等圖像底層視覺特征直接與監(jiān)督學習方法相結(jié)合進行圖像場景分類［２］；或者對場景中的目標進行有效的分析，以完成場景的整體識別，具有代表性的如王濤、胡事民和孫家廣院士提出的基于顏色－空間特征的圖像檢索方法［３］；或者采用文本主題模型的方法將圖像分類到不同的語義類別中：將圖像的局部不變特征聚類為一組視覺詞匯，并用詞袋（Ｂａｇｏｆｗｏｒｄｓ）模型來表示，最后用ＬＤ

7、Ａ（ＬａｔｅｎｔＤｉｒｉｃｈｌｅｔＡｌｌｏｃａｔｉｏｎ）［４］或ＰＬＳＡ（ＰｒｏｂａｂｉｌｉｓｔｉｃＬａｔｅｎｔＳｍａｎｔｉｃＡｎａｌｙｓｉｓ）［５］等主題分析模型找出圖像的潛在語義和最可能屬于的主題，從而完成場景分類。２００ｍｓ）觀察圖像所獲得的視覺和語義信息稱為圖［７］。在拍攝照片時，攝影師總是盡可能把能反映圖ｇｉｓｔ或者語義的對象和特征顯示在圖像中心。這一拍攝習大多數(shù)針對同類目標的圖像都有相同的拍攝角度，即像具有空間相似度。例如，許多城市的圖像是這樣一種高樓下面連接著人行橫道，而頂上是藍天；高速公路是大的平面向水平線方向延伸，期間充滿了一些凹凸。這果我們把

當前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 / 4



此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

用于圖像場景分類的空間視覺詞袋模型

用于圖像場景分類的空間視覺詞袋模型

相關(guān)文章

相關(guān)標簽