資源描述:
《基于本體的教育資源元數(shù)據(jù)檢索模型的研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、內(nèi)蒙古大學(xué)碩士學(xué)位論文第一章緒論1.1問(wèn)題的提出隨著網(wǎng)絡(luò)和網(wǎng)絡(luò)教育的發(fā)展,Intemet上的教育資源也在迅速增長(zhǎng)。由此帶來(lái)的問(wèn)題便是教育資源管理、發(fā)現(xiàn)和獲取的難度增加,迸一步導(dǎo)致教育資源難以復(fù)用,管理系統(tǒng)難以互操作。此外,現(xiàn)有的搜索引擎大多是基于文本和關(guān)鍵字的通用檢索,檢索到的結(jié)果也往往是成百上千條,但這些結(jié)果之間很難具有直接相關(guān)性。這樣的檢索對(duì)于教育資源的查找來(lái)說(shuō)不是一種有效的方法。出現(xiàn)這一問(wèn)題的癥結(jié)在于沒(méi)有對(duì)教育資源進(jìn)行恰當(dāng)?shù)男畔⒚枋?。TimBemers.Lee在2000年12月18日XML2000的
2、會(huì)議上提出了語(yǔ)義Web,他將語(yǔ)義W.eb定義為【l】“語(yǔ)義w-eb是當(dāng)前Web的擴(kuò)展,其中的信息被賦予良好的定義(well—defined),使計(jì)算機(jī)和人能夠更好的協(xié)作"。從這個(gè)定義可以看出,語(yǔ)義Web并不是要取代現(xiàn)有的Web,而是進(jìn)行擴(kuò)展。擴(kuò)展的方式是對(duì)現(xiàn)有信息進(jìn)行形式化的描述,目的是機(jī)器可理解,以便計(jì)算機(jī)更好的提供信息服務(wù)。W3C(WorldWideW如Consortium)是這樣闡述語(yǔ)義Web的121:“將機(jī)器能理解的數(shù)據(jù)發(fā)布在Web上正成為很多組織最優(yōu)先考慮的工作,只有Web成為一個(gè)自動(dòng)工具和人能
3、夠共享和處理數(shù)據(jù)的平臺(tái)時(shí),它的潛能才可能全部發(fā)揮。"本體論是語(yǔ)義Web的重要組成部分,也是語(yǔ)義Web能夠得以實(shí)現(xiàn)的基礎(chǔ)。近年來(lái),知識(shí)本體在人工智能領(lǐng)域引起了研究人員的興趣,并越來(lái)越多地應(yīng)用在萬(wàn)維網(wǎng)信息的表示、組織與管理上,一個(gè)重要原因就是當(dāng)前對(duì)于網(wǎng)絡(luò)的知識(shí)共享和知識(shí)交換存在巨大期望和需求。隨著各種已有的和將要開(kāi)發(fā)的Web應(yīng)用的不斷增多,入們希望不同的系統(tǒng)能夠共享某個(gè)共同公認(rèn)的知識(shí)庫(kù)或者詞匯(術(shù)語(yǔ))集合,提供統(tǒng)一的領(lǐng)域模型,這樣就極大地促進(jìn)和實(shí)現(xiàn)了不同系統(tǒng)間的數(shù)據(jù)或知識(shí)共享、交換和重用。隨著人們對(duì)于教育資源
4、領(lǐng)域的關(guān)注,教育資源逐漸成為一個(gè)分布異構(gòu)環(huán)境中的知識(shí)體系,為領(lǐng)域知識(shí)的語(yǔ)義理解、計(jì)算機(jī)理解、計(jì)算機(jī)和人進(jìn)行交互提供了應(yīng)用框架和實(shí)現(xiàn)途徑。雖然本體在人工智能領(lǐng)域中已經(jīng)被廣泛的談?wù)摵蛯?shí)踐,但在我國(guó)教育資源領(lǐng)域中的研究?jī)H僅局限在概念的界定和初步理論研究層面上,對(duì)于知識(shí)本體的方法論、編碼語(yǔ)言、構(gòu)建工具、具體構(gòu)建缺乏實(shí)踐。本文討論本體在教育資源領(lǐng)域應(yīng)用,并對(duì)本體的描述語(yǔ)言、方法論、構(gòu)建和檢索工具進(jìn)行介紹和分析,希望能夠?yàn)榻逃Y源領(lǐng)域本體的深入建設(shè)提供一個(gè)初步的理論和實(shí)踐的基礎(chǔ)?;诒倔w的教育資源元數(shù)據(jù)檢索模型的研究
5、1.2課題研究的目的和意義解決網(wǎng)絡(luò)環(huán)境下由于系統(tǒng)或資源的異構(gòu)產(chǎn)生的互操作問(wèn)題是目前教育資源領(lǐng)域的核心內(nèi)容?!爱悩?gòu)"是指系統(tǒng)或資源在結(jié)構(gòu)上的不同,互操作是指系統(tǒng)或資源之間的兼容性或關(guān)聯(lián)關(guān)系。萬(wàn)維網(wǎng)上的資源庫(kù)是異構(gòu)的,從數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫(kù)系統(tǒng),到應(yīng)用系統(tǒng);從命名方式、數(shù)據(jù)格式,到結(jié)構(gòu)模型,都有可能完全不同,盡管目前提出很多標(biāo)準(zhǔn)規(guī)范對(duì)各個(gè)層次的異構(gòu)進(jìn)行適當(dāng)?shù)募s束,但是教育資源領(lǐng)域在這個(gè)方面尚缺乏完整的解決方案。元數(shù)據(jù)提供了教育資源領(lǐng)域的語(yǔ)義基礎(chǔ),使資源有了基本的微觀結(jié)構(gòu),但是元數(shù)據(jù)并不能完全解決信息系統(tǒng)的語(yǔ)義異構(gòu)
6、問(wèn)題,包括資源采用不同元數(shù)據(jù)標(biāo)準(zhǔn)造成的微觀結(jié)構(gòu)異構(gòu)問(wèn)題以及資源對(duì)象之間存在的復(fù)雜關(guān)聯(lián)關(guān)系,知識(shí)本體在某種程度上可以看成是“元"元數(shù)據(jù),信息系統(tǒng)中不同實(shí)體對(duì)象可能采用不同的元數(shù)據(jù)方案,不同的實(shí)體對(duì)象之間的關(guān)聯(lián)關(guān)系非常復(fù)雜,知識(shí)本體能夠?qū)@些情況進(jìn)行很好的描述,從而為信息的組織、管理以及檢索、查詢(xún)提供模型和方法。信息檢索作為信息學(xué)領(lǐng)域中最活躍的研究分支之一,其涉及到多學(xué)科領(lǐng)域的交叉合作,主要包括:信息的組織、存儲(chǔ)、索引、異質(zhì)數(shù)據(jù)源的集成和人工智能等技術(shù),信息檢索技術(shù)的研究與發(fā)展和這些相關(guān)領(lǐng)域的發(fā)展是息息相關(guān)的
7、。同樣的,對(duì)新的信息檢索技術(shù)的研究也能推動(dòng)相關(guān)學(xué)科和研究領(lǐng)域的發(fā)展。因此,基于語(yǔ)義的信息檢索技術(shù)研究具有較高的學(xué)術(shù)理論意義。故本文研究如何將本體技術(shù)應(yīng)用到語(yǔ)義檢索系統(tǒng)中來(lái),來(lái)緩解當(dāng)前信息檢索難的這個(gè)問(wèn)題。通過(guò)研究學(xué)習(xí)語(yǔ)義Web理論和相關(guān)技術(shù),構(gòu)建出一個(gè)基于本體的語(yǔ)義檢索模型。以RDF為基礎(chǔ),采用本體技術(shù),將傳統(tǒng)的對(duì)網(wǎng)上信息按關(guān)鍵字查詢(xún)轉(zhuǎn)化為按語(yǔ)義查詢(xún),從而得到相關(guān)度和概念正確度比傳統(tǒng)的搜索引擎更高的查詢(xún)結(jié)果。并且對(duì)今后研究語(yǔ)義搜索算法及基于語(yǔ)義的搜索引擎實(shí)現(xiàn)建立了技術(shù)基礎(chǔ)。使得基于語(yǔ)義的搜索引擎相對(duì)于傳統(tǒng)
8、的搜索引擎,有更高的準(zhǔn)確性,對(duì)未來(lái)如何更好、更準(zhǔn)確地獲取網(wǎng)絡(luò)信息也具有非常重大的意義。在學(xué)習(xí)、探索本體的概念和原理的基礎(chǔ)上,把握目前國(guó)內(nèi)外研究現(xiàn)狀。詳細(xì)分析領(lǐng)域本體建模的成功經(jīng)驗(yàn),討論本體的描述語(yǔ)言,設(shè)計(jì)了本體建模流程,并進(jìn)行本體實(shí)例建模和形式化編碼,建立本體的標(biāo)引思想,對(duì)模型中主要環(huán)節(jié)作了功能定義和詳細(xì)描述。本文建立領(lǐng)域本體,參照本體所描述的領(lǐng)域概念和概念間的關(guān)系,進(jìn)行領(lǐng)域資源標(biāo)引,設(shè)計(jì)領(lǐng)域資源語(yǔ)義檢索模型,根據(jù)概念問(wèn)的關(guān)系