資源描述:
《基于本體的語義檢索在網(wǎng)絡(luò)教育資源中的應(yīng)用研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于本體的語義檢索在網(wǎng)絡(luò)教育資源中的應(yīng)用研究孫 瑞(長春工業(yè)大學(xué)人文信息學(xué)院,吉林長春130122)【摘 要】基于本體的語義檢索是利用本體對用戶提交的查詢..關(guān)鍵詞進行擴展,將經(jīng)優(yōu)化處理過的查詢..關(guān)鍵詞組導(dǎo)入文本檢索引擎中,對文檔資源進行匹配,將查詢結(jié)構(gòu)進行過濾和排序后依次返回給用戶,克服了因信息冗余或丟失缺點的傳統(tǒng)檢索方法,將檢索到的教育資源通過分析器進一步過濾,結(jié)合語義關(guān)聯(lián)度的計算方法,可以很好地解決傳統(tǒng)基于關(guān)鍵字檢索存在的問題,最終得到與檢索要求的內(nèi)容匹配度較高的教育資源。..關(guān)鍵詞本體;語義檢索;網(wǎng)絡(luò)教育資源0 引言在教育領(lǐng)域數(shù)字化步伐迅速加快,數(shù)字
2、化的教育資源呈現(xiàn)井噴式增長的今天,越來越多的用戶通過網(wǎng)絡(luò)來學(xué)習(xí)和研究,這種教育方式也呈現(xiàn)出無限性和復(fù)雜性的特征。傳統(tǒng)的信息檢索是采用基于關(guān)鍵字的匹配方式的方法,這種檢索在覆蓋率與檢索精度等方面存在一定的缺陷,檢索結(jié)果的準(zhǔn)確率比較低,不能很好地滿足用戶的個性化信息需求。如何能讓用戶快速高效檢索到符合需求的信息成為網(wǎng)絡(luò)學(xué)習(xí)領(lǐng)域中急需解決的問題。具體研究內(nèi)容如下所述。1 領(lǐng)域本體構(gòu)建研究對本體論和語義檢索進行深入學(xué)習(xí),結(jié)合網(wǎng)絡(luò)的教育資源建設(shè)元數(shù)據(jù)規(guī)范,構(gòu)建領(lǐng)域本體,為語義檢索奠定堅實基礎(chǔ)。1.1 對本體的基本概述1.1.1 本體概念本體的概念是把現(xiàn)實客觀存在的事物經(jīng)
3、過分解成基本的組成部分之后研究它抽象的本質(zhì)特征。隨著信息技術(shù)的高科技化,本體已經(jīng)廣泛的應(yīng)用于計算機工程領(lǐng)域,用來實現(xiàn)知識上的共享和交互。1.1.2 分類本體按照功能領(lǐng)域,根據(jù)由低到高的程度,把本體分成如下四類:1)頂級本體2)領(lǐng)域本體3)任務(wù)本體4)應(yīng)用本體本文主要研究的是描述特定領(lǐng)域中的概念和概念問的關(guān)系的領(lǐng)域本體。1.2 如何構(gòu)建領(lǐng)域本體由于不同學(xué)科領(lǐng)域的具體工程不同,構(gòu)建本體的方法也各有不同,本體的構(gòu)造方法有很多種都是可行的,其中得到廣泛應(yīng)用的有骨架法、七步法、IDEF-5方法、TOVE企業(yè)建模法。另外,在實際工程構(gòu)建本體時,通常在構(gòu)建規(guī)則的指引下,根據(jù)
4、具體情況的需求,尋求探索出符合自身要求的具體方法。1.3 構(gòu)建教育資源本體的過程無論本體采用什么樣的方法都基本符合Gurber提出的5條本體構(gòu)造的規(guī)則:1)明確性與客觀性:在自然語言的描述下給出術(shù)語較為明確和客觀的語義概念。2)完整性:本體中的概念是能表達(dá)特定術(shù)語集合的完整含義。3)一致性:知識推理所產(chǎn)生的結(jié)果與術(shù)語含義達(dá)到基本的語義一致。4)最大單向可擴展性:在向本體中增加通用術(shù)語和專用術(shù)語的過程中,不輕易修改原有術(shù)語及其含義以保證原有文件的敏感性。5)最少約束:應(yīng)盡可能減少對建模對象的約束條件。同時,本文在網(wǎng)絡(luò)教育資源本體的構(gòu)造中,結(jié)合軟件工程思想和問題的
5、實際情況,設(shè)計出本體構(gòu)建的實際步驟。實際構(gòu)造步驟分為:設(shè)計與準(zhǔn)備階段、本體構(gòu)造階段、測試階段、維護與進化階段。2 語義相似度計算方法的研究2.1 語義相似度的概念語義相似度是指兩概念在意義上的一致程度,在本體樹中可以利用兩個概念間的語義距離來進行衡量。在本文知識點本體中,知識點間相似度主要是通過蘊含關(guān)系體現(xiàn)。由于所有知識點位于本體概念樹的最底層,因此上述構(gòu)建的知識層次網(wǎng)絡(luò)中,影響語義相似度的因素我們主要考慮如下幾點:語義距離、關(guān)系類型、節(jié)點密度、語義重合度。2.2 語義相似度的算法語義相似度算法的語義檢索的核心,是進行語義匹配的基礎(chǔ)。其主要是利用本體理論對檢索
6、詞進行語義化處理形成查詢向量,通過對查詢向量與資源向量相似度進行計算實現(xiàn)語義檢索的匹配。設(shè)計一種詞語間的語義相似度的計算方法,并將算法用在構(gòu)建本體階段,計算候選名詞詞條之間的語義相似度,由此確定本體中的概念,輔助本體的構(gòu)建過程。3 語義檢索模型的設(shè)計及優(yōu)化3.1 語義檢索概念語義檢索是在語義網(wǎng)上進行查詢檢索的技術(shù),又把語義檢索稱為概念匹配,在語義網(wǎng)中傳輸、存儲的數(shù)據(jù)不但要給用戶顯示出來,而且還要求讓機器進行“理解、分析”,即匹配在語義上相同、相近、相包含的詞語。例如,用戶需要檢索“操作系統(tǒng)”,“UNIX、LINUX、WINDOWS”也是與之相匹配的詞語。與傳統(tǒng)
7、的檢索技術(shù)相比,它能提高檢索的精度和覆蓋率,減少了不相關(guān)冗余的返回結(jié)果。3.2 語義檢索模型的設(shè)計及優(yōu)化本文在研究知識點本體構(gòu)建、語義關(guān)聯(lián)度計算方法相關(guān)技術(shù)的基礎(chǔ)上,結(jié)合教學(xué)領(lǐng)域,建立一個基于本體的教育資源語義檢索模型。同時,理論與實踐相結(jié)合,初步設(shè)計實現(xiàn)了教育資源語義檢索系統(tǒng),并將之投入到實際平臺應(yīng)用中,預(yù)期會取得了較好的檢索效果。通過分析教育資源知識點本體的語義相關(guān)性特點提出了一種基于知識點本體的語義相似度的計算方法。該方法通過將概念間關(guān)系進行分離,利用概念層次結(jié)構(gòu)和關(guān)聯(lián)關(guān)系并考慮多種影響因素(如語義距離、節(jié)點密度等)分別計算語義相似度,進而綜合量化成語義
8、關(guān)聯(lián)度。利用前兩步的成果,設(shè)計一個語義