資源描述:
《基于領(lǐng)域本體的語(yǔ)義檢索系統(tǒng)的研究與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、太原理工大學(xué)碩士研究生學(xué)位論文KEYWORDS:DomainOntology,InformationRetrieval,SemanticInference,OWL,SemanticRetrievalV太原理工大學(xué)碩士研究生學(xué)位論文聲明本人鄭重聲明:所呈交的學(xué)位論文,是本人在指導(dǎo)教師的指導(dǎo)下,獨(dú)立進(jìn)行研究所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本論文不包含其他個(gè)人或集體己經(jīng)發(fā)表或撰寫過(guò)的科研成果。對(duì)本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均己在文中以明確方式標(biāo)明。本聲明的法律責(zé)任由本人承擔(dān)。論文作者簽名:日期:關(guān)于學(xué)位論文使用權(quán)的說(shuō)明本人完全了解太原
2、理工大學(xué)有關(guān)保管、使用學(xué)位論文的規(guī)定,其中包括:○1學(xué)校有權(quán)保管、并向有關(guān)部門送交學(xué)位論文的原件與復(fù)印件;○2學(xué)校可以采用影印、縮印或其它子復(fù)制手段復(fù)制并保存學(xué)位論文;○3學(xué)??稍试S學(xué)位論文被查閱或借閱;○4學(xué)??梢詫W(xué)術(shù)交流為目的,復(fù)制贈(zèng)送和交換學(xué)位論文;○5學(xué)??梢怨紝W(xué)位論文的全部或部分內(nèi)容(保密學(xué)位論文在解密后遵守此規(guī)定)。作者簽名:日期:導(dǎo)師簽名:日期:太原理工大學(xué)碩士研究生學(xué)位論文第一章緒論1.1課題提出及研究背景信息檢索是指從現(xiàn)有的信息集合中查找所需要的信息的過(guò)程和方法。其中現(xiàn)有的信息集合可以是有組織的文獻(xiàn)整體,也可以是數(shù)據(jù)庫(kù)的全部記
3、錄、還可以是某個(gè)文獻(xiàn)收藏單位收藏[1]的全部文獻(xiàn),以及人們通過(guò)Internet發(fā)布的各類信息集合。當(dāng)前,隨著Internet的快速發(fā)展和計(jì)算機(jī)的普及,人們已經(jīng)逐步邁入了網(wǎng)絡(luò)信息時(shí)代,網(wǎng)絡(luò)信息資源開始日益呈現(xiàn)出爆炸式增長(zhǎng)趨勢(shì),這一方面在為用戶提供一個(gè)快捷方便的信息共享的資源平臺(tái)的同時(shí),傳統(tǒng)的信息檢索也開始日益暴露出諸如“信息迷航”、“信息過(guò)載”等各種問題。再加上用戶對(duì)信息檢索的要求越來(lái)越高,人們要想利用傳統(tǒng)的各種信息檢索技術(shù)從網(wǎng)絡(luò)上快速準(zhǔn)確地獲取信息也變得越來(lái)越困難。如何迅速、高效地檢索和訪問各個(gè)領(lǐng)域的信息資源以促進(jìn)信息的交流與共享是一個(gè)急需解決的
4、重要問題。未來(lái)的互聯(lián)網(wǎng)作為人類共享的信息庫(kù)、知識(shí)庫(kù),最好應(yīng)該支持用戶以自然語(yǔ)言的方式表達(dá)的檢索請(qǐng)求,并且具備一定的語(yǔ)義理解和語(yǔ)義擴(kuò)展推理能力。而本文正是針對(duì)上述問題設(shè)計(jì)了一個(gè)基于領(lǐng)域本體的語(yǔ)義檢索系統(tǒng),通過(guò)構(gòu)建領(lǐng)域本體、設(shè)計(jì)推理規(guī)則、對(duì)資源進(jìn)行語(yǔ)義標(biāo)注從而較好地實(shí)現(xiàn)了語(yǔ)義推理功能,不僅能得到與檢索條件在語(yǔ)法上精確匹配的信息資源,而且還能檢索到與檢索條件具有語(yǔ)義相關(guān),但在語(yǔ)法上并不精確匹配的、以及一些隱含的信息資源,在一定程度上提高了檢索的查全率和查準(zhǔn)率。1.2信息檢索研究現(xiàn)狀目前的信息檢索已經(jīng)發(fā)展到網(wǎng)絡(luò)化的階段。信息檢索的對(duì)象從相對(duì)封閉、穩(wěn)定、一
5、致、由獨(dú)立數(shù)據(jù)庫(kù)集中管理的結(jié)構(gòu)化的信息內(nèi)容擴(kuò)展到了形態(tài)各異、無(wú)結(jié)構(gòu)、分布廣泛、管理松散的Web內(nèi)容;信息檢索的用戶也由原來(lái)的情報(bào)專業(yè)人員擴(kuò)展到包括商務(wù)人員、管理人員、教師學(xué)生、各專業(yè)人士等在內(nèi)的普通大眾。另外,近年來(lái)研究者們努力將信息檢索對(duì)象從面向結(jié)構(gòu)化的數(shù)據(jù)發(fā)展到面向半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),從單一文本數(shù)據(jù)發(fā)展到聲音、圖片和多媒體視頻。可以說(shuō)信息檢索已經(jīng)成為現(xiàn)在人們?nèi)粘I钪胁豢扇鄙俚牟糠?。互?lián)網(wǎng)技術(shù)的不斷發(fā)展給信息的傳播方式帶來(lái)了巨大的變化,也明顯地促進(jìn)了信息檢索技術(shù)的發(fā)展和應(yīng)用,一大批搜索引擎產(chǎn)品也隨之誕生,為網(wǎng)民提供了快速獲取信息和網(wǎng)絡(luò)信
6、1太原理工大學(xué)碩士研究生學(xué)位論文息導(dǎo)航的工具。隨著網(wǎng)上信息量的激增和用戶需求的不斷提升,傳統(tǒng)的信息檢索技術(shù)開始難以滿足用戶的需求,于是人們開始致力于信息檢索的新的研究,以求探索新的、更好的信息檢索技術(shù),在這過(guò)程中逐漸發(fā)展起了一種以自然語(yǔ)言理解技術(shù)為基礎(chǔ)的新一代信息檢索,被稱為智能信息檢索,也可以稱其為語(yǔ)義信息檢索或知識(shí)檢索。由于這種新的信息檢索技術(shù)將信息檢索從目前基于關(guān)鍵詞詞形、語(yǔ)法的層面提高了到基于知識(shí)、語(yǔ)義的層面,對(duì)被檢索的信息有一定的理解、推理能力。相當(dāng)于不再單純是對(duì)信息的檢索,而是提升到了對(duì)賦予了一定語(yǔ)義的知識(shí)的檢索。從而在一定程度上提高
7、了檢索的查全率和查準(zhǔn)率。目前,智能信息檢索的研發(fā)主要有兩大方向,其一是基于機(jī)器翻譯技術(shù),比如Google;其二是基于語(yǔ)義理解技術(shù)的,國(guó)內(nèi)有尤里卡、問一問,國(guó)外的主要代表是AskJeeves。語(yǔ)義理解通過(guò)將語(yǔ)言學(xué)的研究成果和信息檢索技術(shù)結(jié)合在一起,實(shí)現(xiàn)了信息檢索對(duì)檢索詞在語(yǔ)義層次上的理解,為用戶提供了最確切的檢索服務(wù)?;谡Z(yǔ)義理解技術(shù)的智能信息檢索,即語(yǔ)義檢索。目前語(yǔ)義檢索有兩種,即基于本體論的語(yǔ)義檢索和基于概念的語(yǔ)義檢索,前者是基于本體構(gòu)建概念空間實(shí)現(xiàn)的語(yǔ)義檢索,而后者是根據(jù)概念詞典和關(guān)系數(shù)據(jù)庫(kù)構(gòu)建概念空間,從而實(shí)現(xiàn)的語(yǔ)義檢索?;诟拍畹恼Z(yǔ)義檢索
8、具有一定語(yǔ)義處理能力和較好的自然語(yǔ)言接口。但概念信息檢索的概念庫(kù)中不包含概念間關(guān)系的描述,這樣就無(wú)法處理有關(guān)概念關(guān)系的問題。而基于本體論