基于patent ontology的智能檢索系統(tǒng)demo

基于patent ontology的智能檢索系統(tǒng)demo

ID:19793462

大?。?49.50 KB

頁數(shù):34頁

時(shí)間:2018-10-06

基于patent ontology的智能檢索系統(tǒng)demo_第1頁
基于patent ontology的智能檢索系統(tǒng)demo_第2頁
基于patent ontology的智能檢索系統(tǒng)demo_第3頁
基于patent ontology的智能檢索系統(tǒng)demo_第4頁
基于patent ontology的智能檢索系統(tǒng)demo_第5頁
資源描述:

《基于patent ontology的智能檢索系統(tǒng)demo》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、基于Ontology的智能檢索技術(shù)研究與實(shí)踐受中國科學(xué)院青年創(chuàng)新基金項(xiàng)目:《基于本體的智能檢索技術(shù)探索與實(shí)踐》資助。1、本文中涉及程序代碼有部分來自于Franz公司StudyCenter的教學(xué)代碼及Jena的參考文檔。技術(shù)白皮書《基于本體的智能檢索技術(shù)探索與實(shí)踐》課題組2008年12月基于PatentOntology的智能檢索系統(tǒng)Demo相關(guān)背景與傳統(tǒng)數(shù)據(jù)庫相比,知識(shí)庫是一種全新的信息組織方式與信息服務(wù)模式,它不包含了大量的信息,而且也包含了信息之間的規(guī)則和關(guān)聯(lián)。其特點(diǎn)是:存儲(chǔ)海量結(jié)構(gòu)化/非結(jié)構(gòu)化信息,信息或者知識(shí)隨時(shí)添

2、加;通過在原始數(shù)據(jù)層上添加語意層,實(shí)現(xiàn)信息之間可推導(dǎo)及知識(shí)發(fā)現(xiàn);通過語意層,提供基于知識(shí)的查詢。知識(shí)庫的這些特性支持:運(yùn)用最新的智能工具來挖掘蘊(yùn)藏于海量顯性信息中的隱性知識(shí),并實(shí)現(xiàn)知識(shí)的可檢索、可推導(dǎo),并形成專業(yè)知識(shí)庫和知識(shí)倉庫,將隱性知識(shí)顯性化并給予管理、利用,非常符合知識(shí)服務(wù)中用戶對(duì)個(gè)性化、隱性知識(shí)的需求,能夠真正支撐起信息化建設(shè)中要求的顯性知識(shí)與隱性知識(shí)全方位開發(fā)戰(zhàn)略。知識(shí)庫通過有效促進(jìn)知識(shí)的流轉(zhuǎn)與共享過程,加速了隱性知識(shí)的顯性化,促發(fā)新知識(shí)的發(fā)現(xiàn)。在未來的信息化系統(tǒng)建設(shè)中,以知識(shí)庫為基礎(chǔ)的信息化平臺(tái)建設(shè)將逐漸成為

3、主流。對(duì)于知識(shí)庫而言,其最核心的部分是”如何合理有效的表示知識(shí)”,即知識(shí)表示。知識(shí)表示是對(duì)知識(shí)的一種描述或一組約定,是知識(shí)的形式化和符號(hào)化過程。本體(ontology)通過對(duì)于概念、術(shù)語及其相互關(guān)系的規(guī)范化描述,勾畫出某一領(lǐng)域的基本知識(shí)體系和描述語言。雖然基于本體的知識(shí)庫研究仍處于發(fā)展的前期,在技術(shù)與應(yīng)用上還有很多難題尚待解決,但其已成為建設(shè)知識(shí)庫的主流技術(shù),已經(jīng)引起了學(xué)術(shù)界與產(chǎn)業(yè)界的廣泛關(guān)注,一些面向?qū)嶋H應(yīng)用的知識(shí)庫系統(tǒng)也已經(jīng)出現(xiàn)。基于本體的智能檢索技術(shù)作為知識(shí)庫系統(tǒng)的重要組成部分,其研究與實(shí)踐對(duì)知識(shí)庫系統(tǒng)的建設(shè)將大有

4、裨益。本技術(shù)指南是中國科學(xué)院青年創(chuàng)新基金項(xiàng)目:《基于本體的智能檢索技術(shù)探索與實(shí)踐》項(xiàng)目研究總結(jié)。其主要內(nèi)容是:從理論探討了知識(shí)庫系統(tǒng)的框架層次,并分析了每一層具體功能與部分技術(shù)細(xì)節(jié)。在實(shí)踐方面,重點(diǎn)實(shí)踐了與智能檢索技術(shù)密切相關(guān)的數(shù)據(jù)層、語義圖層、推理層相關(guān)技術(shù)。以基于專利本體的智能檢索為例,根據(jù)上述理論研究成果,進(jìn)行了探索與實(shí)踐。該Demo檢索模塊主要針對(duì)專利檢索中的申請(qǐng)人字段進(jìn)行基于本體的擴(kuò)展,首先從檢索分析器中提取出可以進(jìn)行本體擴(kuò)展的部分,然后由本體庫的推理引擎對(duì)其進(jìn)行擴(kuò)展,實(shí)現(xiàn)智能檢索。重點(diǎn)討論了本體的持久化、利用

5、Prolog實(shí)現(xiàn)本體推理、基于SPARQL的本體查詢等技術(shù)。通過實(shí)踐,總結(jié)了基于本體的智能檢索技術(shù)與傳統(tǒng)檢索擴(kuò)展技術(shù)的區(qū)別,在實(shí)踐上總結(jié)了規(guī)則與本體結(jié)合的重要性,希望為國科圖知識(shí)庫系統(tǒng)研建起到拋磚引玉的作用。體系結(jié)構(gòu)本體建模目前,還沒有公認(rèn)的最佳本體建模方法,大多處于具體問題具體分析階段。經(jīng)調(diào)研,主要有以下三種本體建模方法:愛丁堡大學(xué)總結(jié)出來的“骨架法”、多倫多大學(xué)總結(jié)的TOVE本體建立模式、馬德里大學(xué)工藝分校開發(fā)人工智能圖書館時(shí)發(fā)展出來的Meth本體方法等。有學(xué)者認(rèn)為如使用IEEE標(biāo)準(zhǔn)—軟件生命周期法IEEE1074來

6、評(píng)價(jià)上述方法,“骨架法”更符合該評(píng)價(jià)標(biāo)準(zhǔn)。其開發(fā)過程簡述如下:根據(jù)研究領(lǐng)域的任務(wù)等實(shí)際情況,確定本體的應(yīng)用目標(biāo)和范圍。吸引專家參與進(jìn)行本體分析,確定本體中術(shù)語意義及其關(guān)系。最大限度搜索已存在的Ontology,避免資源重復(fù)建設(shè),利用本體的開放性,對(duì)本體進(jìn)行提煉、擴(kuò)充。并對(duì)Ontology進(jìn)行初步設(shè)計(jì)。根據(jù)本體構(gòu)造原則,運(yùn)用適當(dāng)語言對(duì)術(shù)語及其關(guān)系進(jìn)行形式化描述。確定評(píng)價(jià)標(biāo)準(zhǔn),對(duì)本體進(jìn)行評(píng)價(jià)。最后在上述基礎(chǔ)上建立本體[1,2,3]。項(xiàng)目組也認(rèn)為“骨架法”是目前較好的本體建模方法。有關(guān)“骨架法”的具體描述請(qǐng)參見參考文獻(xiàn)2。需要

7、說明的是,各種本體建設(shè)方法論多誕生在具體的本體建設(shè)項(xiàng)目之中,在相應(yīng)的項(xiàng)目中得到實(shí)踐。這些方法之間并沒有太大的差別,并且都和軟件工程中常見的開發(fā)過程相類似,可以綜合一下這幾種方法,從而制定自己的一套方法論[2]?,F(xiàn)在本體構(gòu)建工具多達(dá)十余種,其功能重點(diǎn)面向本體構(gòu)建的各個(gè)方面,對(duì)于本體語言的支持能力、表達(dá)能力、邏輯支持能力以及可擴(kuò)展性、靈活性、易用性等都相差很大,其中較著名的有Protégé、TBC、NeOnToolkit、OntoEdit、OilEd、Ontolingua等。Protégé是一個(gè)斯坦福大學(xué)開發(fā)的本體編輯和知識(shí)

8、獲取軟件。開發(fā)語言采用Java,屬于開放源碼軟件,由于其優(yōu)秀的設(shè)計(jì)和眾多的插件,Protégé已成為目前使用最廣泛的本體論編輯器之一,Protégé本體可導(dǎo)出為各種格式,包括Clips、UML、DAML+OIL、RDF(S)、OWL和XMLSchema[4]。目前,Protégé用戶群體非常廣泛,隱約成為本體編輯的代

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。