資源描述:
《一種基于本體的混合檢索方法》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第l9卷第l期計(jì)算機(jī)技術(shù)與發(fā)展V(,I.19N12009年1月COMP[TfERTECHNOL(X~YANDDE\rELOPMENTJ}m.2《)()9一種基于本體的混合檢索方法楊學(xué)兵,孫航(安徽工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,安徽馬鞍山243002)摘要:提出了一種基于本體的,綜合改進(jìn)的spreadactivati0n算法和語(yǔ)義分析的混合檢索方法。通過(guò)改進(jìn)的spreadactiva.tion算法和本體實(shí)例之間語(yǔ)義關(guān)聯(lián)強(qiáng)弱的分析,得到一組查詢(xún)?cè)~的相似詞集合,從而提高了查詢(xún)關(guān)鍵字到本體概念映射的完整性與準(zhǔn)確性。設(shè)計(jì)實(shí)現(xiàn)了相應(yīng)的檢索系統(tǒng),實(shí)
2、驗(yàn)表明,該系統(tǒng)可以有效地提高檢索的查全率與查準(zhǔn)率。關(guān)鍵詞:spreadactivation;語(yǔ)義關(guān)聯(lián);語(yǔ)義檢索中圖分類(lèi)號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1673—629X(2009)01—0125—03AHybridRetrievalMethodBasedonOntologyYANGXue—bing,SUNHang(SchoolofComputerScienceofAnhuiUniversityofTechnology,Maanshan243002,China)Abstract:Bringforwardahybridre
3、trievalmethodwhichintegratesthespreadactivationarithmeticandsemanticanalysisbasedOnontolo-gy.Thesemanticanalysisbetweenthemodifiedspreadactivationarithmeticandontologicalsamplescallgetthesimilarwordsaggregateofthewordsyouwanttosearchfortoenhancetheintegrityandaccur
4、acyoftheontologymappingofkeywords.Thedesigncanrealizethecorrespondingretrievalsystem.a(chǎn)ndtheexperimentalsoindicatesthatthissystemcanimproverecallratioandprecisionratioeffectively.Keywords:spreadactivation;semanticrelevanoe;semanticretrieval0引言字到本體庫(kù)映射過(guò)程中,因?yàn)椴荒艽_定用戶(hù)的意圖,
5、可隨著網(wǎng)絡(luò)所能提供的信息內(nèi)容、網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)能能產(chǎn)生與用戶(hù)查詢(xún)關(guān)系不大的以及錯(cuò)誤的關(guān)鍵字到本力提供方法的不斷發(fā)展,網(wǎng)絡(luò)的規(guī)模有了爆炸性的增體實(shí)例的映射,導(dǎo)致查準(zhǔn)率有了一定程度的下降。長(zhǎng),搜索引擎成了幫助人們尋找相關(guān)信息的重要工具。AnyanwuK,ShethA.【5J提出了語(yǔ)義關(guān)聯(lián)的概念,利用目前的搜索引擎普遍存在查全率和查準(zhǔn)率不高的現(xiàn)此概念,能有效提高搜索的準(zhǔn)確性。梅翔,孟祥武】提象,任何一個(gè)簡(jiǎn)單的查詢(xún)都可能返回?cái)?shù)以萬(wàn)計(jì)的檢索出的一種基于語(yǔ)義關(guān)聯(lián)的查詢(xún)優(yōu)化方法,就是利用語(yǔ)結(jié)果,而其中只有很少一部分與查詢(xún)需求相關(guān)。義關(guān)聯(lián)的概
6、念,將詞法關(guān)系和語(yǔ)義分析相結(jié)合,在基于語(yǔ)義網(wǎng)l_1J被認(rèn)為是下一代的網(wǎng)絡(luò)技術(shù),它的核心本體應(yīng)用的基礎(chǔ)上,產(chǎn)生用于傳統(tǒng)搜索的關(guān)鍵字。與是用元數(shù)據(jù)描述網(wǎng)絡(luò)上的資源,使機(jī)器能理解網(wǎng)頁(yè)的利用用戶(hù)直接輸入的查詢(xún)關(guān)鍵字相比,在擴(kuò)展性和精內(nèi)容。語(yǔ)義網(wǎng)的技術(shù)已經(jīng)廣泛地應(yīng)用到了搜索引擎。確性方面都有一定程度的提高,其中語(yǔ)義分析的方法基于資源描述框架的問(wèn)答系統(tǒng)(QuizRDF)[J結(jié)合了傳提高了搜索的精確性。統(tǒng)的純文本的搜索和RDF注釋的資源查詢(xún)、導(dǎo)航技結(jié)合語(yǔ)義關(guān)聯(lián)的方法的優(yōu)點(diǎn),對(duì)RochaC,Schwabe術(shù),能比較快速地收斂到用戶(hù)查詢(xún)的目標(biāo)
7、,但它不具備D提出的檢索方法進(jìn)行改進(jìn),提出了一種綜合spread發(fā)掘概念間關(guān)系的能力。作者RochaC,SchwabeDJactivation[7J和語(yǔ)義分析的混合檢索方法。以及GubaR,McCoolJ將用戶(hù)輸入映射到本體知識(shí)庫(kù),通過(guò)本體關(guān)系推導(dǎo),發(fā)現(xiàn)與用戶(hù)輸入相關(guān)的概念。1算法其中,作者RochaC,SchwabeD[3J提出的一種基于語(yǔ)義1.1WeightMapping技術(shù)網(wǎng)的檢索方法可以有效提高查詢(xún)的查全率。但在關(guān)鍵本體及其本體實(shí)例中,有很大一部分信息是隱藏在它們之間的關(guān)系中,而不是明顯表達(dá)的。在傳統(tǒng)本收稿日期:20
8、(18一O6一O5體中只能指出兩個(gè)概念實(shí)例之間的關(guān)系存在與否。而基金項(xiàng)目:安徽省自然科學(xué)基金重點(diǎn)資助項(xiàng)目(2004KJ053ZD)作者簡(jiǎn)介:楊學(xué)兵(1967一),男,安徽巢湖人,教授,研究方向?yàn)閿?shù)據(jù)很多情況下,指出關(guān)系之間的權(quán)重也是很有必要的。挖掘。一種經(jīng)典的方法就是在本體實(shí)例之間的鏈接上