資源描述:
《基于ontology的智能檢索技術研究與實踐》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、基于Ontology的智能檢索技術研究與實踐基金項目:本文受中國科學院西部之光項目:《基于本體的天然藥物知識推理系統(tǒng)的設計與應用》;中國科學院知識創(chuàng)新工程青年人才領域前沿項目:《基于本體的智能檢索技術探索與實踐》資助。作者簡介:1胡正銀,男,研究生,1979—,中國科學院國家科學圖書館成都分館(成都文獻情報中心)信息技術部工程師,四川大學公共管理學院情報學碩士研究生,已發(fā)表論文6篇。研究方向:知識管理與數(shù)據(jù)挖掘。通信地址:四川省成都市人民南路四段九號中國科學院成都文獻情報中心。聯(lián)系電話:028-85220240。Email:huzy@clas.ac.cn。2
2、方曙,男,博士,1957—,中科院國家科學圖書館副館長,成都分館館長,中科院研究生院情報學博士生導師、四川大學公共管理學院情報學碩士研究生導師,已發(fā)表論文60余篇。研究方向:知識管理與情報分析。3鄭穎,女,博士,1973—,中科院國家科學圖書館副研究員,已經(jīng)發(fā)表論文多篇。研究方向:知識管理與情報分析。4鐘秀琴,女,博士,1976—,中科院成都計算機應用研究所,副研究員,已經(jīng)發(fā)表論文多篇。研究方向:知識庫。MethodofDevelopmentandArchitectureofanOntology-BasedintelligentretrievalSystem
3、胡正銀1,2,方曙2,鄭穎2,鐘秀琴3(1.四川大學公共管理學院,成都610041;2.中科院國家科學圖書館成都分館,3.中科院成都計算機應用研究所,成都610041)【摘要】:本文在調研基于本體智能檢索相關技術的基礎上,總結和討論了其建設方法與體系結構?;诒倔w的智能檢索系統(tǒng)體系結構從下至上可分為:數(shù)據(jù)層、語義圖層、推理層、查詢層、接口層。論文具體討論了一個基于中醫(yī)藥本體的實驗性智能檢索系統(tǒng)實現(xiàn)的詳細過程,重點論述了語義圖層、推理層的技術實現(xiàn),并指出了在實際建設中需注意的一些問題?!娟P鍵詞】:本體;智能檢索;知識庫;推理規(guī)則【中圖分類號】G250【文章標識
4、碼】A1、引言傳統(tǒng)的學科信息門戶多提供基于學科分類的資源導航服務與基于關鍵詞匹配的檢索服務,由于信息之間缺乏語意的關聯(lián),因此很難提供基于知識的服務?;诒倔w的智能檢索技術在傳統(tǒng)的關鍵詞匹配檢索的基礎上,通過添加了語義層,可實現(xiàn)基于語義的智能檢索,目前已成為研究的熱點[1]。雖然基于ontology的智能檢索技術研究仍處于發(fā)展的前期,還有很多研究難題,但其已經(jīng)引起了包括圖書情報界在內(nèi)的廣泛關注。2、智能檢索系統(tǒng)體系結構以語義網(wǎng)七層體系結構為參考,基于本體的智能檢索系統(tǒng)結構如下[2]:接口層(提供用戶和應用程序接口)查詢層(在語義圖的基礎上,實現(xiàn)智能查詢)推理層
5、(提供基于規(guī)則的知識推理和知識發(fā)現(xiàn)的功能)語義圖層(對概念進行語義描述,用定義的關系連接各種概念,并對數(shù)據(jù)庫中的資源進行語義映射,建立領域知識的核心語義圖)數(shù)據(jù)層(有機地整合多源數(shù)據(jù)和通用本體,并提供遠程訪問接口)圖1基于本體的智能檢索系統(tǒng)體系結構圖Fig1“ontology-basedintelligentretrieval”architecturediagram1、數(shù)據(jù)層:有機地整合多源數(shù)據(jù)及通用本體等,并提供遠程訪問其它相關數(shù)據(jù)的接口。2、語義圖層:在已有數(shù)據(jù)庫及文獻資料等資源的基礎上,采用RDF,OWL等描述語言對數(shù)據(jù)庫的各類數(shù)據(jù)和資源進行語義描述和
6、關系映射,建立一個領域知識的核心語義圖。該語義圖可擴展、可讀寫、可推導。逐步構建領域的本體[3]。3、推理層:推理規(guī)則的提取與描述,利用推理引擎如:Jena或RacePro或RDFProlog等,實現(xiàn)知識推理和新知識發(fā)現(xiàn)的功能。4、查詢層:在語義圖的基礎上,利用推理功能,根據(jù)數(shù)字圖書館知識服務的需要,可建立知識查詢服務。5、接口層:在一個查詢界面下實現(xiàn)跨數(shù)據(jù)庫查詢和數(shù)據(jù)整合,使得用戶查詢更加便利和全面,提供用戶和應用程序接口。1、智能檢索實驗性系統(tǒng)的實現(xiàn)本文以AllegroGraph知識庫管理系統(tǒng)為基礎,以AllegroGraph知識庫系統(tǒng)自帶的RDFPro
7、log語言作為推理規(guī)則描述語言,在Java環(huán)境下實現(xiàn)了一個基于中醫(yī)藥本體的智能檢索演示系統(tǒng),具體方案描述如下:1、數(shù)據(jù)層:在中藥專家的指導下,以《中國中醫(yī)藥主題詞表》[4],《中國大百科全書·中醫(yī)》[5]中醫(yī)卷,國科圖成都分館自建的天然藥物數(shù)據(jù)庫相關內(nèi)容,作為本系統(tǒng)的數(shù)據(jù)源。主要涉及的數(shù)據(jù)包括:中草藥的分類及其味,性,效等屬性;中藥方劑分類療效及組成等屬性;中醫(yī)病癥的癥狀等屬性。2、語義圖層:采用OWL描述語言對數(shù)據(jù)層數(shù)據(jù)進行描述,建立本體文件。該本體包含相關概念之間的關系及部分中草藥,中藥方劑實例的映射關系,形成該領域核心語義圖。在本體的建設過程中,根據(jù)中
8、醫(yī)藥主題詞表的分類標準,采用自上而下的設計方法。如在