資源描述:
《基于語義的數(shù)字圖書館檢索模型研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于語義的數(shù)字圖書館檢索模型研究 摘要:隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,數(shù)字圖書館已經(jīng)成為信息傳播和獲取的重要途徑。而現(xiàn)階段的數(shù)字圖書館缺乏具有語義性的匹配,同時(shí)沒有提供計(jì)算機(jī)可讀的語義信息。結(jié)合圖書館的具體應(yīng)用,構(gòu)建了基于本體語義技術(shù)的數(shù)字圖書館檢索模型,并設(shè)計(jì)實(shí)現(xiàn)了一個(gè)檢索系統(tǒng)原型,然后綜合分析并利用DC元數(shù)據(jù),建立了描述圖書元數(shù)據(jù)的本體,同時(shí)結(jié)合圖書館的具體應(yīng)用,構(gòu)建了基于本體語義技術(shù)的擴(kuò)展檢索模型。最后,根據(jù)上述擴(kuò)展檢索模型設(shè)計(jì)了檢索系統(tǒng)原型,并通過三組實(shí)驗(yàn)對比,驗(yàn)證了構(gòu)建的檢索模型的有效性和實(shí)用性?! £P(guān)鍵詞:數(shù)字圖書館;語義檢索;本體;語義擴(kuò)展 中圖分類號:TN911?
2、34;TM417文獻(xiàn)標(biāo)識(shí)碼:A文章編號:1004?373X(2016)09?0103?04 Abstract:Withtherapiddevelopmentofnetworktechnology,thedigitallibraryhasbecomeanimportantwayofinformationtransmissionandacquisition.Thedigitallibraryatthisstagelacksthesemanticmatching,andcan′tprovidethesemanticinformationwithcomputerreadable.Th
3、edigitallibraryretrievalmodelbasedonontologysemantictechnologywasconstructed.Aretrievalsystemprototypewasdesignedandimplemented.Andthen,theontologytodescribethebookmetadatawasestablishedby9syntheticallyanalyzingandusingDCmetadata,andtheextensionretrievalmodelbasedonontologysemantictechnology
4、wasconstructedincombinationwiththespecificapplicationofthelibrary.Finally,accordingtotheextensionretrievalmodel,theretrievalsystemprototypewasdesigned.Theeffectivenessandpracticabilityoftheconstructedretrievalmodelwasverifiedwiththeexperimentalcomparisonofthreegroups. Keywords:digitallibrar
5、y;semanticretrieval;ontology;semanticextension 0引言 對于數(shù)字圖書館的形式可以概括為以下兩種:高校的圖書館檢索系統(tǒng),它將圖書信息數(shù)字化,并提供了一個(gè)檢索系統(tǒng),方便學(xué)生進(jìn)行借閱;類似超星數(shù)字圖書館、中國知網(wǎng)或是中國國家數(shù)字圖書館等數(shù)字圖書館網(wǎng)站,不僅提供圖書、期刊、專利等信息資源的檢索,還提供在線試讀和下載、相關(guān)學(xué)術(shù)的新聞視頻等一系列綜合信息[1]。 數(shù)字圖書館實(shí)現(xiàn)數(shù)字化的兩個(gè)關(guān)鍵技術(shù)就是資源的數(shù)字化以及檢索系統(tǒng),而這兩個(gè)關(guān)鍵技術(shù)目前存在缺乏語義性的表現(xiàn),直接導(dǎo)致用戶檢索效果不佳,影響了用戶的閱讀體驗(yàn)[2]。傳統(tǒng)的搜索引擎沒有
6、處理任何學(xué)科領(lǐng)域的知識(shí),所以他們不能理解用戶的搜索請求以及文章的內(nèi)在聯(lián)系,沒有傳統(tǒng)圖書館的用戶挑選過程,即包含語義性的過程[3]?! ?圖書館學(xué)本體構(gòu)建 1.1必備條件9 基于作者的專業(yè),本文所選取的研究學(xué)科領(lǐng)域?yàn)椤皥D書館學(xué)”,且目前這一學(xué)科領(lǐng)域的本體沒有被提出。根據(jù)“圖書館學(xué)”相關(guān)書籍以及專家學(xué)者的建議,將“圖書館學(xué)”的相關(guān)概念進(jìn)行提取、歸類,并比較各個(gè)數(shù)據(jù)庫中的相關(guān)圖書期刊,充實(shí)該學(xué)科領(lǐng)域本體[4]?! 。?)工具語言的選擇階段。系統(tǒng)均采用OWL本體語言,Protégé本體構(gòu)建工具?! 。?)需求分析。涉及學(xué)科領(lǐng)域?yàn)椤皥D書館學(xué)”,目的就是提高“圖書館學(xué)”相關(guān)圖書檢索的語
7、義性,從而提高圖書的查全率以及查準(zhǔn)率,所以需要給出“圖書館學(xué)”領(lǐng)域的專業(yè)概念以及相互之間的關(guān)系、實(shí)例等。系統(tǒng)設(shè)計(jì)的用戶主要有兩類:一類是圖書館的普通用戶即讀者,他們只是需要檢索這個(gè)功能,這部分也是這個(gè)系統(tǒng)研究的重要部分;另外一類是圖書館管理人員,他不僅需要檢索,而且需要負(fù)責(zé)本體的整個(gè)維護(hù)工作。為了保證本體的持久性,本文選擇使用MySQL數(shù)據(jù)庫對本體文件進(jìn)行存儲(chǔ)[5]?! 。?)領(lǐng)域?qū)<业膮⑴c。領(lǐng)域本體構(gòu)建的結(jié)果是獲得這一領(lǐng)域的共同認(rèn)識(shí),所以應(yīng)該在領(lǐng)域?qū)<业膸椭拢餐⑦@一學(xué)科的本體[6]