本體論及語(yǔ)義搜索引擎(1)

ID:24245833

大小:52.50 KB

頁(yè)數(shù):4頁(yè)

時(shí)間:2018-11-13

本體論及語(yǔ)義搜索引擎(1)_第1頁(yè)
本體論及語(yǔ)義搜索引擎(1)_第2頁(yè)
本體論及語(yǔ)義搜索引擎(1)_第3頁(yè)
本體論及語(yǔ)義搜索引擎(1)_第4頁(yè)
資源描述:

《本體論及語(yǔ)義搜索引擎(1)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、本體論及語(yǔ)義搜索引擎(1)1 引言網(wǎng)絡(luò)信息檢索已成為我們獲取信息主要手段。根據(jù)NIC的統(tǒng)計(jì)數(shù)據(jù)[1]:目前中國(guó)用戶上網(wǎng)的最主要目的中,信息獲取以42.3%位居榜首;有98.7%的人表示通過(guò)互聯(lián)網(wǎng)來(lái)獲取信息,其中有71.9%的人是通過(guò)搜索引擎來(lái)查找相關(guān)網(wǎng)站的。然而網(wǎng)絡(luò)信息檢索面臨兩個(gè)亟待解決的關(guān)鍵問(wèn)題:(1)搜索的結(jié)果相關(guān)度低,冗余信息太多;(2)搜索引擎無(wú)法對(duì)常識(shí)性問(wèn)題給予回答,智能化水平低。出現(xiàn)上述問(wèn)題的原因在于目前檢索技術(shù)主要依賴(lài)于編碼技術(shù),通過(guò)分類(lèi)模式來(lái)描述給定的信息;通過(guò)基于字符串匹配的全文檢索技術(shù),來(lái)搜索用戶提交的關(guān)鍵詞。由

2、于編碼描述只能反映出部分語(yǔ)義,因此不能保證語(yǔ)義的匹配;檢索過(guò)程是把用戶的查詢關(guān)鍵詞與全文中的每一個(gè)詞進(jìn)行比較,而不考慮查詢請(qǐng)求與文檔語(yǔ)義上的匹配。針對(duì)上述兩個(gè)關(guān)鍵問(wèn)題,本文運(yùn)用本體論的相關(guān)知識(shí),提出基于本體構(gòu)建的語(yǔ)義搜索引擎模型。該模型能夠根據(jù)用戶的查詢關(guān)鍵字或者詢問(wèn)問(wèn)題,進(jìn)行基于知識(shí)的推理,從而提高檢索結(jié)果的相關(guān)度,并且實(shí)現(xiàn)一定水平的語(yǔ)義檢索。  2 本體論  2.1 本體的概念本體這個(gè)術(shù)語(yǔ)來(lái)自于哲學(xué),根據(jù)韋氏詞典的解釋?zhuān)倔w是形而上學(xué)的一個(gè)分支。目前本體在人工智能領(lǐng)域得到廣泛研究和應(yīng)用,但尚未形成統(tǒng)一的定義,最廣為流傳的定義有[2

3、]:定義1:本體是對(duì)共享概念模型的形式化明確說(shuō)明。它有幾個(gè)要點(diǎn):★ 概念模型(conceptualization):指通過(guò)抽象客觀世界中一些現(xiàn)象(Phenomenon)的相關(guān)概念而得到的模型,其表示的含義獨(dú)立于具體的環(huán)境狀態(tài);★ 明確(explicit):指所使用的概念及使用這些概念的約束都有明確的定義;★ 形式化(formal):指Ontology是計(jì)算機(jī)可讀的;★ 共享(share):指Ontology中體現(xiàn)的是共同認(rèn)可的知識(shí),反映的是相關(guān)領(lǐng)域中公認(rèn)的概念集,它所針對(duì)的是團(tuán)體而不是個(gè)體。(轉(zhuǎn)載自zunication)、互操作(in

4、teroperability)和系統(tǒng)工程(systemsengineering)。(1)所謂通訊是指本體為人與人之間或組織與組織之間的通訊提供共同的詞匯,即交流的基礎(chǔ)。(2)互操作說(shuō)明本體建立了在不同的建模方法、范式、語(yǔ)言和軟件工具之間進(jìn)行翻譯和映射的機(jī)制,以實(shí)現(xiàn)不同系統(tǒng)之間集成。(作文網(wǎng)zw.nseac.整理)(3)系統(tǒng)工程:本體分析能夠?yàn)橄到y(tǒng)工程提供以下方面的好處:★ 重用(reusability):本體是領(lǐng)域內(nèi)的重要實(shí)體、屬性、過(guò)程及其相互關(guān)系形式化描述的基礎(chǔ)。這種形式化描述可成為軟件系統(tǒng)中可重用和共享的組件(ponent)?!?/p>

5、 知識(shí)獲取(knowledgeacquisition):當(dāng)構(gòu)造基于知識(shí)的系統(tǒng)時(shí),用已有的本體作為起點(diǎn)和基礎(chǔ)來(lái)指導(dǎo)知識(shí)的獲取,可以提高其速度和可靠性?!铩】煽啃?reliability):由于本體的描述是形式化的,形式化的表達(dá)使得自動(dòng)的一致性檢查成為可能,從而提高了軟件系統(tǒng)的可靠性?!铩∫?guī)范描述(specification):本體分析有助于確定系統(tǒng)(如知識(shí)庫(kù))的需求和規(guī)范?! ? 基于本體語(yǔ)義搜索引擎  3.1 基于本體搜索引擎的設(shè)計(jì)思想本體提供了人機(jī)交流的機(jī)制,使得機(jī)器可以理解語(yǔ)義,從而為搜索引擎提高效率奠定了基礎(chǔ)?;诒倔w的搜索引擎

6、的基本設(shè)計(jì)思想:(1)在領(lǐng)域?qū)<业膸椭?,建立相關(guān)領(lǐng)域的本體(Ontology);(2)收集信息源中的數(shù)據(jù),并參照已建立的Ontology,把收集來(lái)的數(shù)據(jù)按規(guī)定的格式存儲(chǔ)在元數(shù)據(jù)庫(kù)(關(guān)系數(shù)據(jù)庫(kù)、知識(shí)庫(kù)等)中:(3)對(duì)用戶檢索界面獲取的查詢請(qǐng)求,查詢轉(zhuǎn)換器按照Ontology把查洵請(qǐng)求轉(zhuǎn)換成規(guī)定的格式,在Ontology的幫助下從元數(shù)據(jù)庫(kù)中匹配出符合條件的數(shù)據(jù)集合;(4)檢索的結(jié)果經(jīng)過(guò)定制處理后,返回給用戶?! ?.2 知識(shí)庫(kù)實(shí)現(xiàn)基于本體的語(yǔ)義搜索引擎,建立知識(shí)庫(kù)是必需的。知識(shí)庫(kù)是語(yǔ)義搜索引擎進(jìn)行推理和知識(shí)積累的基礎(chǔ)和關(guān)鍵,而Ontol

7、ogy則是知識(shí)庫(kù)的基礎(chǔ)。一般來(lái)說(shuō),本體提供一組術(shù)語(yǔ)和概念來(lái)描述某個(gè)領(lǐng)域,知識(shí)庫(kù)則使用這些術(shù)語(yǔ)來(lái)表達(dá)該領(lǐng)域的事實(shí)。例如醫(yī)藥本體可能包含“白血病”、“皮膚病”等術(shù)語(yǔ)的定義,但它不會(huì)包含具體某一病人的診斷結(jié)果,而這正是知識(shí)庫(kù)所要表達(dá)的內(nèi)容。比如張三患有皮膚病、李四患有皮膚病和白血病、王五患有白血病,其中的皮膚病、白血病就是本體。而各個(gè)病癥的實(shí)例(張三、李四、王五)及其病癥描述就是知識(shí)庫(kù)的內(nèi)容。(轉(zhuǎn)載自zw.nseac.作文網(wǎng))本體和知識(shí)庫(kù)的關(guān)系有幾個(gè)要點(diǎn):★ Ontology為知識(shí)庫(kù)的建立提供一個(gè)基本的結(jié)構(gòu);★ Ontology提供一套概念

8、和術(shù)語(yǔ)來(lái)描述某一領(lǐng)域,并且獲取該領(lǐng)域的本質(zhì)的概念結(jié)構(gòu);★ 知識(shí)庫(kù)就運(yùn)用這些術(shù)語(yǔ)去表達(dá)現(xiàn)實(shí)或者虛擬世界中的正確知識(shí)。因此,建設(shè)一個(gè)知識(shí)庫(kù)的第一步就是對(duì)該領(lǐng)域進(jìn)行有效的Ontology分析。共2頁(yè):1[2]下一頁(yè)

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。
关闭