資源描述:
《基于Ontology的智能檢索技術(shù)研究及實踐》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、基于Ontology的智能檢索技術(shù)研究與實踐基金項目:本文受中國科學(xué)院西部之光項目:《基于本體的天然藥物知識推理系統(tǒng)的設(shè)計與應(yīng)用》;中國科學(xué)院知識創(chuàng)新工程青年人才領(lǐng)域前沿項目:《基于本體的智能檢索技術(shù)探索與實踐》資助。作者簡介:1胡正銀,男,研究生,1979—,中國科學(xué)院國家科學(xué)圖書館成都分館(成都文獻(xiàn)情報中心)信息技術(shù)部工程師,四川大學(xué)公共管理學(xué)院情報學(xué)碩士研究生,已發(fā)表論文6篇。研究方向:知識管理與數(shù)據(jù)挖掘。通信地址:四川省成都市人民南路四段九號中國科學(xué)院成都文獻(xiàn)情報中心。聯(lián)系電話:028-85220240。Email:hu
2、zy@clas.ac.cn。2方曙,男,博士,1957—,中科院國家科學(xué)圖書館副館長,成都分館館長,中科院研究生院情報學(xué)博士生導(dǎo)師、四川大學(xué)公共管理學(xué)院情報學(xué)碩士研究生導(dǎo)師,已發(fā)表論文60余篇。研究方向:知識管理與情報分析。3鄭穎,女,博士,1973—,中科院國家科學(xué)圖書館副研究員,已經(jīng)發(fā)表論文多篇。研究方向:知識管理與情報分析。4鐘秀琴,女,博士,1976—,中科院成都計算機(jī)應(yīng)用研究所,副研究員,已經(jīng)發(fā)表論文多篇。研究方向:知識庫。MethodofDevelopmentandArchitectureofanOntology-B
3、asedintelligentretrievalSystem胡正銀1,2,方曙2,鄭穎2,鐘秀琴3(1.四川大學(xué)公共管理學(xué)院,成都610041;2.中科院國家科學(xué)圖書館成都分館,3.中科院成都計算機(jī)應(yīng)用研究所,成都610041)【摘要】:本文在調(diào)研基于本體智能檢索相關(guān)技術(shù)的基礎(chǔ)上,總結(jié)和討論了其建設(shè)方法與體系結(jié)構(gòu)?;诒倔w的智能檢索系統(tǒng)體系結(jié)構(gòu)從下至上可分為:數(shù)據(jù)層、語義圖層、推理層、查詢層、接口層。論文具體討論了一個基于中醫(yī)藥本體的實驗性智能檢索系統(tǒng)實現(xiàn)的詳細(xì)過程,重點(diǎn)論述了語義圖層、推理層的技術(shù)實現(xiàn),并指出了在實際建設(shè)中需注
4、意的一些問題?!娟P(guān)鍵詞】:本體;智能檢索;知識庫;推理規(guī)則【中圖分類號】G250【文章標(biāo)識碼】A1、引言傳統(tǒng)的學(xué)科信息門戶多提供基于學(xué)科分類的資源導(dǎo)航服務(wù)與基于關(guān)鍵詞匹配的檢索服務(wù),由于信息之間缺乏語意的關(guān)聯(lián),因此很難提供基于知識的服務(wù)?;诒倔w的智能檢索技術(shù)在傳統(tǒng)的關(guān)鍵詞匹配檢索的基礎(chǔ)上,通過添加了語義層,可實現(xiàn)基于語義的智能檢索,目前已成為研究的熱點(diǎn)[1]。雖然基于ontology的智能檢索技術(shù)研究仍處于發(fā)展的前期,還有很多研究難題,但其已經(jīng)引起了包括圖書情報界在內(nèi)的廣泛關(guān)注。2、智能檢索系統(tǒng)體系結(jié)構(gòu)以語義網(wǎng)七層體系結(jié)構(gòu)為參
5、考,基于本體的智能檢索系統(tǒng)結(jié)構(gòu)如下[2]:接口層(提供用戶和應(yīng)用程序接口)查詢層(在語義圖的基礎(chǔ)上,實現(xiàn)智能查詢)推理層(提供基于規(guī)則的知識推理和知識發(fā)現(xiàn)的功能)語義圖層(對概念進(jìn)行語義描述,用定義的關(guān)系連接各種概念,并對數(shù)據(jù)庫中的資源進(jìn)行語義映射,建立領(lǐng)域知識的核心語義圖)數(shù)據(jù)層(有機(jī)地整合多源數(shù)據(jù)和通用本體,并提供遠(yuǎn)程訪問接口)圖1基于本體的智能檢索系統(tǒng)體系結(jié)構(gòu)圖Fig1“ontology-basedintelligentretrieval”architecturediagram1、數(shù)據(jù)層:有機(jī)地整合多源數(shù)據(jù)及通用本體等,并
6、提供遠(yuǎn)程訪問其它相關(guān)數(shù)據(jù)的接口。2、語義圖層:在已有數(shù)據(jù)庫及文獻(xiàn)資料等資源的基礎(chǔ)上,采用RDF,OWL等描述語言對數(shù)據(jù)庫的各類數(shù)據(jù)和資源進(jìn)行語義描述和關(guān)系映射,建立一個領(lǐng)域知識的核心語義圖。該語義圖可擴(kuò)展、可讀寫、可推導(dǎo)。逐步構(gòu)建領(lǐng)域的本體[3]。3、推理層:推理規(guī)則的提取與描述,利用推理引擎如:Jena或RacePro或RDFProlog等,實現(xiàn)知識推理和新知識發(fā)現(xiàn)的功能。4、查詢層:在語義圖的基礎(chǔ)上,利用推理功能,根據(jù)數(shù)字圖書館知識服務(wù)的需要,可建立知識查詢服務(wù)。5、接口層:在一個查詢界面下實現(xiàn)跨數(shù)據(jù)庫查詢和數(shù)據(jù)整合,使得用
7、戶查詢更加便利和全面,提供用戶和應(yīng)用程序接口。1、智能檢索實驗性系統(tǒng)的實現(xiàn)本文以AllegroGraph知識庫管理系統(tǒng)為基礎(chǔ),以AllegroGraph知識庫系統(tǒng)自帶的RDFProlog語言作為推理規(guī)則描述語言,在Java環(huán)境下實現(xiàn)了一個基于中醫(yī)藥本體的智能檢索演示系統(tǒng),具體方案描述如下:1、數(shù)據(jù)層:在中藥專家的指導(dǎo)下,以《中國中醫(yī)藥主題詞表》[4],《中國大百科全書·中醫(yī)》[5]中醫(yī)卷,國科圖成都分館自建的天然藥物數(shù)據(jù)庫相關(guān)內(nèi)容,作為本系統(tǒng)的數(shù)據(jù)源。主要涉及的數(shù)據(jù)包括:中草藥的分類及其味,性,效等屬性;中藥方劑分類療效及組成等
8、屬性;中醫(yī)病癥的癥狀等屬性。2、語義圖層:采用OWL描述語言對數(shù)據(jù)層數(shù)據(jù)進(jìn)行描述,建立本體文件。該本體包含相關(guān)概念之間的關(guān)系及部分中草藥,中藥方劑實例的映射關(guān)系,形成該領(lǐng)域核心語義圖。在本體的建設(shè)過程中,根據(jù)中醫(yī)藥主題詞表的分類標(biāo)準(zhǔn),采用自上而下的設(shè)計方法。如在