xml模式匹配算法的研究

xml模式匹配算法的研究

ID:34133835

大小:1.56 MB

頁數(shù):70頁

時間:2019-03-03

xml模式匹配算法的研究_第1頁
xml模式匹配算法的研究_第2頁
xml模式匹配算法的研究_第3頁
xml模式匹配算法的研究_第4頁
xml模式匹配算法的研究_第5頁
資源描述:

《xml模式匹配算法的研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、西安電子科技大學(xué)學(xué)位論文創(chuàng)新性聲明秉承學(xué)校嚴(yán)謹(jǐn)?shù)膶W(xué)風(fēng)和優(yōu)良的科學(xué)道德,本人聲明所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果;也不包含為獲得西安電子科技大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中做了明確的說明并表示了謝意。申請學(xué)位論文與資料若有不實(shí)之處,本人承擔(dān)一切的法律責(zé)任。本人簽名:日期西安電子科技大學(xué)關(guān)于論文使用授權(quán)的說明本人完全

2、了解西安電子科技大學(xué)有關(guān)保留和使用學(xué)位論文的規(guī)定,即:研究生在校攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)單位屬西安電子科技大學(xué)。學(xué)校有權(quán)保留送交論文的復(fù)印件,允許查閱和借閱論文;學(xué)??梢怨颊撐牡娜炕虿糠謨?nèi)容,可以允許采用影印、縮印或其它復(fù)制手段保存論文。同時本人保證,畢業(yè)后結(jié)合學(xué)位論文研究課題再撰寫的文章一律署名單位為西安電子科技大學(xué)。(保密的論文在解密后遵守此規(guī)定)本學(xué)位論文屬于保密,在年解密后適用本授權(quán)書。本人簽名:日期導(dǎo)師簽名:日期摘要XML逐漸成為了網(wǎng)絡(luò)中數(shù)據(jù)表示、數(shù)據(jù)分析和數(shù)據(jù)交換的標(biāo)準(zhǔn)。但由于XML數(shù)

3、據(jù)描述的靈活性,以及XML文檔數(shù)量和規(guī)模的日益增大,如何高效的管理大規(guī)模XML數(shù)據(jù)以及集成大量的XML數(shù)據(jù)資源變得十分重要。因此用于識別XML模式之間的一致性元素的自動XML模式匹配技術(shù)成為許多領(lǐng)域亟待解決的問題。本文在分析研究現(xiàn)有模式匹配方法的基礎(chǔ)上,結(jié)合XML模式中元素的信息特征,綜合考慮匹配質(zhì)量和匹配效率,提出了一種新的XML模式匹配算法。它主要包括模式的預(yù)處理和匹配算法兩個部分。首先,模式經(jīng)過簡化處理表示為一種序列結(jié)構(gòu)CPS(ConsolidatedPrüferSequence)。然后用綜合語言匹配

4、和結(jié)構(gòu)匹配的混合匹配算法對模式進(jìn)行匹配。語言匹配充分利用模式元素的特征信息,包括名稱匹配、數(shù)據(jù)類型匹配和基數(shù)約束匹配,其中名稱匹配采用決策樹的原理合并多種字符串匹配算法。結(jié)構(gòu)匹配算法中,首先用孩子元素、葉子元素、祖先元素和兄弟元素的信息計算所有復(fù)雜元素對的結(jié)構(gòu)相似值,得到匹配的復(fù)雜元素對。然后僅把結(jié)構(gòu)匹配算法應(yīng)用到匹配復(fù)雜元素對下的原子元素,而不是計算所有原子元素的結(jié)構(gòu)相似值,這種結(jié)構(gòu)匹配方法易于發(fā)現(xiàn)復(fù)雜匹配。最后為了進(jìn)一步改善效率本文設(shè)計了幾種并行策略,提出了并行語言匹配算法和并行非復(fù)雜節(jié)點(diǎn)的結(jié)構(gòu)匹配算法

5、。通過大量實(shí)驗(yàn),驗(yàn)證了本文的模式匹配算法具有高效性,并行改進(jìn)的算法也具有可行性。關(guān)鍵字:XML模式模式匹配相似值CPS決策樹AbstractXMLhasemergedasastandardfordatarepresentation,dataanalysisanddataexchangeontheWeb.However,duetotheflexibilityofdatadescriptionandtheincreaseinthenumberandthesizeofXMLdocuments,howtoeffic

6、ientlymanagelargeXMLdataandintegratelotsofXMLdatasourceshavebecomevital.ThereforeanautomaticXMLschemamatchingusedtoidentifysemanticcorrespondencesamongXMLschemasisanurgentprobleminmanydomains.Analyzingtheexistingmethodsofschemamatchingandcombiningwiththein

7、formationcharactersofelementinXMLschema,thispaperproposesanewapproachofXMLschemamatchingwhichconsidersbothmatchingqualityandmatchingefficiency.Itconsistsmainlyoftwoparts-schemapre-processingandmatchingalgorithm.FirsteachsimplifiedXMLschemaisrepresentedasas

8、equencecalledCPS(ConsolidatedPrüferSequence).Thenmatchingalgorithmisappliedontwoschemas.Itisahybridmatchercombininglinguisticmatcherandstructuralmatcher.Comprehensivelyexploitingthefeatureinformationofelement

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。