資源描述:
《圖像語(yǔ)義提取方法研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、圖像語(yǔ)義提取方法研宄摘要:為解決從圖像的低層視覺(jué)特征到高層語(yǔ)義特征的“語(yǔ)義鴻溝”問(wèn)題,對(duì)當(dāng)前的語(yǔ)義提取方法進(jìn)行研究,簡(jiǎn)單介紹了圖像語(yǔ)義層次模型,并根據(jù)語(yǔ)義信息的來(lái)源不同,歸納總結(jié)了圖像語(yǔ)義中基于處理范圍的方法,基于機(jī)器學(xué)習(xí)的方法,基于人機(jī)交互的方法和基于外部信息源的提取方法,這些工作為圖像語(yǔ)義提取和圖像語(yǔ)義檢索等研宄提供有益參考。關(guān)鍵詞:語(yǔ)義提?。痪植克阕?;支持向量機(jī);語(yǔ)義標(biāo)注中圖分類(lèi)號(hào):TN919-34;TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1004-373X(2011)24-0103-04ResearchonImageSemanticExtra
2、ctionWEIHanLIBi-chengZHANGRui-jieTANG丫ong-wang(Depart,ofInformationScience,InformationEngineeringInstitute,InformationEngineeringUniversity,Zhengzhou450002,China)Abstract:Thecurrentimagesemanticextractionmethodisresearchedtofindasolutiontoeliminatethe"semanticgap1'betweenlow
3、-levelvisualfeaturesandhigh-levelsemanticfeaturesofimages.Theimagesemanticlevelmodelissimplyintroduced.Accordingtothesemanticinformationextractedfromdifferentsources,theinformationextractionmethodsbasedonprocessingregion,machinelearning,man-machinealternationandexternalinfor
4、mationsourcearesummedup.Theaboveworkprovidesavaluablereferenceforimagesemanticextractionandretrieval.Keywords:semanticextraction;localoperator;SVM;semanticannotation收稿日期:2011-07-10基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(60872142)隨著多媒體和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)圖像資源與日俱增,圖像已經(jīng)成為一種非常重要的信息資源,其包含的信息量遠(yuǎn)遠(yuǎn)大于文字,因此如何充分理解
5、圖像中所包含的語(yǔ)義內(nèi)容、如何真正有效地利用語(yǔ)義進(jìn)行圖像資源的檢索,如今己成為一個(gè)重要的課題。計(jì)算機(jī)對(duì)圖像內(nèi)容的理解一般指圖像的低層視覺(jué)特征,如顏色、紋理、形狀等;而實(shí)際上,人類(lèi)對(duì)圖像的理解即圖像語(yǔ)義信息表達(dá)的內(nèi)容要遠(yuǎn)遠(yuǎn)多于圖像的視覺(jué)特征。這種從圖像低層視覺(jué)特征與圖像高層語(yǔ)義特征之間存在著的較大差距,即“語(yǔ)義鴻溝”[1]?,F(xiàn)在,圖像語(yǔ)義提取已成為解決圖像低層視覺(jué)特征與人類(lèi)高級(jí)語(yǔ)義之間“語(yǔ)義鴻溝”的關(guān)鍵技術(shù),許多學(xué)者在此方面也進(jìn)行了大量的嘗試性工作和研宄。1語(yǔ)義層次模型圖像語(yǔ)義模型是圖像語(yǔ)義直觀形象的描述形式。通過(guò)語(yǔ)義模型,能使用戶(hù)了解和掌握如何從
6、圖像中提取語(yǔ)義特征,對(duì)于更好地理解和應(yīng)用圖像的語(yǔ)義信息具有重要作用。根據(jù)圖像中各語(yǔ)義要素間組合的抽象程度,圖像語(yǔ)義按圖像語(yǔ)義層次模型大致可分為特征語(yǔ)義、對(duì)象語(yǔ)義、空間關(guān)系語(yǔ)義、場(chǎng)景語(yǔ)義、行為語(yǔ)義和情感語(yǔ)義等6個(gè)層次,用以對(duì)不同層次的圖像內(nèi)容進(jìn)行描述,這個(gè)模型稱(chēng)為圖像層次化語(yǔ)義模型。圖像的語(yǔ)義層次可用圖1來(lái)簡(jiǎn)單描述,其中的每一部分對(duì)應(yīng)于圖像的一個(gè)語(yǔ)義層次,并相應(yīng)于人對(duì)圖像的理解層次。圖中的箭頭表示語(yǔ)義的級(jí)別,下一個(gè)層次通常包含了比上一個(gè)層次更高級(jí)更抽象的語(yǔ)義,而更高層的語(yǔ)義往往通過(guò)較低層的語(yǔ)義推理而獲得。考慮到圖像語(yǔ)義的模糊性、復(fù)雜性、抽象性,圖
7、像的語(yǔ)義模型主要包括以下幾種語(yǔ)義特征:(1)視覺(jué)特征語(yǔ)義(如顏色、紋理、結(jié)構(gòu)、形狀、運(yùn)動(dòng)等),與視覺(jué)感知直接相連,稱(chēng)為低層語(yǔ)義;(2)對(duì)象語(yǔ)義(如人、物等)和空間關(guān)系語(yǔ)義(如人在房前,球狀草地上等),這需要進(jìn)行一定的邏輯推理并識(shí)別出圖像中目標(biāo)的類(lèi)別,它們合稱(chēng)為對(duì)象層;(3)場(chǎng)景語(yǔ)義(如海濱、曠野、室內(nèi)等)、行為語(yǔ)義(如進(jìn)行圖像檢索、表演節(jié)目等)和情感語(yǔ)義(如賞心悅目的圖像、使人興奮的視頻等),合稱(chēng)為概念層,由于涉及到圖像的抽象屬性,需要對(duì)所描述的目標(biāo)和場(chǎng)景的含義進(jìn)行高層推理。2圖像語(yǔ)義提取方法按照語(yǔ)義層次模型劃分,人們正在研究的語(yǔ)義提取主要包括
8、:對(duì)目標(biāo)類(lèi)別和目標(biāo)空間關(guān)系語(yǔ)義的提取,這常需借助領(lǐng)域知識(shí);對(duì)場(chǎng)景和行為語(yǔ)義的提取,也就是對(duì)圖像和場(chǎng)景理解和解釋?zhuān)粚?duì)情感語(yǔ)義的提取,這目前主要在藝術(shù)圖像