資源描述:
《機(jī)器學(xué)習(xí)在本體映射中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、機(jī)器學(xué)習(xí)在本體映射中的應(yīng)用 李瓊李寶敏 (1.西安工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院710032; 收稿日期: 基金輔助:國(guó)家“星火計(jì)劃”項(xiàng)目:西北農(nóng)業(yè)專家遠(yuǎn)程信息化服務(wù)體系示范(項(xiàng)目號(hào)2004EA850069) 作者簡(jiǎn)介:李瓊(1984.08),女,河南三門峽,西安工業(yè)大學(xué),碩士研究生,研究方向:計(jì)算機(jī)網(wǎng)絡(luò)與語(yǔ)義網(wǎng).Emal:jianniya@126.com手機(jī):13488220647 李寶敏(1949.09),男,河南鞏義,西安工業(yè)大學(xué)教授,碩士生導(dǎo)師,研究方向:計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)、計(jì)算機(jī)網(wǎng)絡(luò)與語(yǔ)
2、義網(wǎng)Emal:mbl369@126.com 通信作者:李瓊,郵箱:jianniya@126.com 2.西安工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院710032) 摘要:(目的)本文針對(duì)語(yǔ)義網(wǎng)中的本體異構(gòu)問題,(方法)提出利用人工智能研究中的機(jī)器學(xué)習(xí)算法來(lái)解決。(結(jié)果)通過(guò)概念映射使其語(yǔ)義更好地得到匹配,并在果品領(lǐng)域經(jīng)過(guò)實(shí)例的應(yīng)用,其效果還是客觀的。(結(jié)論)在本體映射匹配研究中,機(jī)器學(xué)習(xí)發(fā)揮了很大的作用,對(duì)語(yǔ)義重疊的概念進(jìn)行高效率的推理匹配映射,為語(yǔ)義網(wǎng)本體異構(gòu)環(huán)境下實(shí)現(xiàn)信息在語(yǔ)義上的互操作提供了一種
3、解決的途徑。 關(guān)鍵詞:語(yǔ)義Web,機(jī)器學(xué)習(xí)算法,決策樹算法,分類樹,概念映射 1引言 語(yǔ)義網(wǎng)(SemanticWeb)是在本體(Ontology)理論基礎(chǔ)之上對(duì)現(xiàn)有Web所進(jìn)行的擴(kuò)展,其目標(biāo)是使Web上的信息具有計(jì)算機(jī)可以理解的語(yǔ)義,在本體的支持下實(shí)現(xiàn)信息在語(yǔ)義上的互操作,以及對(duì)Web資源所進(jìn)行的智能訪問和檢索。(研究的重要意義)語(yǔ)義網(wǎng)服務(wù)是以語(yǔ)義網(wǎng)和本體為基礎(chǔ)的一個(gè)重要的基礎(chǔ)研究領(lǐng)域,其目標(biāo)是通過(guò)將語(yǔ)義網(wǎng)技術(shù)和Web服務(wù)技術(shù)相結(jié)合,提供下一代網(wǎng)絡(luò)的集成平臺(tái)。 語(yǔ)義網(wǎng)服務(wù)中大量的本
4、體由于應(yīng)用的領(lǐng)域不同,組織、設(shè)計(jì)者不同,其結(jié)構(gòu)和概念的表達(dá)形式也存在著一定的差異,因此造成了本體的異構(gòu)性。本體映射指的是在多個(gè)本體之間找到語(yǔ)義相同或相似的對(duì)應(yīng)元素,從而在多個(gè)本體之間建立語(yǔ)義聯(lián)系,消除不同本體或本體不同版本之間知識(shí)表達(dá)時(shí)的不一致現(xiàn)象,進(jìn)而達(dá)到真正意義上的知識(shí)共享。本體映射是解決不同本體間的知識(shí)共享和重用問題的有效方法。(前人研究進(jìn)展)目前本體映射大多是由人工手動(dòng)來(lái)完成的,(研究的切入點(diǎn))不僅過(guò)程煩雜,而且很容易出錯(cuò)。這極大地影響了本體映射自動(dòng)化程度和準(zhǔn)確性。(研究擬解決的關(guān)鍵問題)
5、機(jī)器學(xué)習(xí)是解決這類問題的有效方法之一[1]。在此將對(duì)目前機(jī)器學(xué)習(xí)研究的主要趨勢(shì)、理論與技術(shù)以及存在的問題,在本體映射中的應(yīng)用做一詳細(xì)的介紹?! ?機(jī)器學(xué)習(xí) 機(jī)器學(xué)習(xí)是研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。機(jī)器學(xué)習(xí)的研究是根據(jù)生理學(xué)、認(rèn)知科學(xué)等對(duì)人類學(xué)習(xí)機(jī)理的了解,建立人類學(xué)習(xí)過(guò)程的計(jì)算模型或認(rèn)識(shí)模型,發(fā)展各種學(xué)習(xí)理論和學(xué)習(xí)方法,研究通用的學(xué)習(xí)算法并進(jìn)行理論上的分析,建立面向任務(wù)的具有特定應(yīng)用的學(xué)習(xí)系統(tǒng)。這些研究目標(biāo)相互影響相互促
6、進(jìn)?! C(jī)器學(xué)習(xí)在人工智能的研究中具有十分重要的地位?!C(jī)器學(xué)習(xí)系統(tǒng)是一個(gè)具有學(xué)習(xí)能力的智能系統(tǒng),它可以推理演繹加以歸納知識(shí),證明已存在的事實(shí)、定理,并能歸納總結(jié)新的規(guī)則、定理和定律,遇到錯(cuò)誤能自我校正,通過(guò)經(jīng)驗(yàn)對(duì)自身性能加以改進(jìn),可以不斷的自動(dòng)獲取和發(fā)現(xiàn)所需要的知識(shí)。 隨著人工智能的深入發(fā)展,機(jī)器學(xué)習(xí)逐漸成為人工智能研究的核心之一。它的應(yīng)用已遍及人工智能的各個(gè)分支,如專家系統(tǒng)、自動(dòng)推理、自然語(yǔ)言理解、模式識(shí)別、計(jì)算機(jī)視覺、智能機(jī)器人等領(lǐng)域?! 臋C(jī)器學(xué)習(xí)的執(zhí)行部分所反映的任務(wù)類型上看,目前大部
7、分的應(yīng)用研究領(lǐng)域基本上集中于以下兩個(gè)范疇:分類和問題求解?! ?機(jī)器學(xué)習(xí)算法 機(jī)器學(xué)習(xí)的中心問題是從特殊的訓(xùn)練樣例中歸納出一般函數(shù)。發(fā)展至今,機(jī)器學(xué)習(xí)算法已經(jīng)有很多,并有了廣泛的應(yīng)用。常見的算法有:概念學(xué)習(xí),決策樹學(xué)習(xí),支持向量機(jī)((SVM),人工神經(jīng)網(wǎng)絡(luò),貝葉斯((Bayes)學(xué)習(xí),遺傳算法,基于實(shí)例的學(xué)習(xí),規(guī)則學(xué)習(xí)等等[3]?!?1)決策樹算法描述 決策樹算法是應(yīng)用最廣泛的歸納推理算法之一,在數(shù)據(jù)挖掘的分類,生成規(guī)則方面都有很多應(yīng)用。大多數(shù)己開發(fā)的決策樹學(xué)習(xí)是ID3算法一種核心算法的變體。
8、 決策樹是通過(guò)把實(shí)例從根節(jié)點(diǎn)排列到某個(gè)葉子節(jié)點(diǎn)的方法來(lái)分類實(shí)例,葉子節(jié)點(diǎn)即為實(shí)例所屬的分類。樹上每個(gè)節(jié)點(diǎn)說(shuō)明了對(duì)實(shí)例的某個(gè)屬性的測(cè)試,并且該節(jié)點(diǎn)的每個(gè)后繼分支對(duì)應(yīng)于該屬性的一個(gè)可能值。決策樹分類實(shí)例的方法是從這棵樹的根結(jié)點(diǎn)開始,測(cè)試這個(gè)結(jié)點(diǎn)指定的屬性,然后按照給定實(shí)例的該屬性值對(duì)應(yīng)的樹枝向下移動(dòng)。然后這個(gè)過(guò)程在以新結(jié)點(diǎn)為根的子樹上重復(fù)?!。?)ID3算法描述 ID3算法采用自頂向下的貪婪搜索遍歷可能的決策樹空間,這種方法也是后繼的C4.5算法的基礎(chǔ)。基本的ID3算法通過(guò)自頂向下構(gòu)造