資源描述:
《基于模式結(jié)構(gòu)和已知匹配知識的模式匹配模型的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、Y1219871分類號UDC密級學(xué)位論文基于模式結(jié)構(gòu)和已知匹配知識的模式匹配模型的研究作者姓名:余恩運指導(dǎo)教師:中請學(xué)位級別:學(xué)科專業(yè)名稱:論文提交日期:學(xué)位授予日期:評閱人:申德榮教授東北大學(xué)軟件理論與研究所碩士學(xué)科類別:工學(xué)計算機(jī)應(yīng)用技術(shù)2007年1月10日淪文答辯日期:2007年1月22日鍘懶縱:王大泠崔嚨蕾孫娃東北大學(xué)2007年1月東北大學(xué)碩士學(xué)位論文摘要基于模式結(jié)構(gòu)和已知匹配知識的模式匹配模型的研究摘要在大量的數(shù)據(jù)庫應(yīng)用中,如面向Web的數(shù)據(jù)集成、電子商務(wù)、數(shù)據(jù)倉庫、數(shù)據(jù)庫設(shè)計等,都需要用到模式信息。而操作模
2、式信息的一個最基本的操作就是匹配,即將兩個模式作為輸入,產(chǎn)生兩個模式中互相對應(yīng)的元素的映射。早期的模式匹配工作是為數(shù)據(jù)集成服務(wù)的,近年來,電子商務(wù)的出現(xiàn)進(jìn)一步推動了模式匹配的研究,在電子商務(wù)應(yīng)用中也需要通過模式匹配實現(xiàn)不同信息系統(tǒng)之間的數(shù)據(jù)轉(zhuǎn)換。當(dāng)今模式匹配技術(shù)仍存在許多問題,大多仍以人工(領(lǐng)域?qū)<一蛳到y(tǒng)丌發(fā)人員)定義方式為主,費時費力且容易出錯。這個問題也隨著Web數(shù)據(jù)源的快速增加和電子商務(wù)的一體化而日益嚴(yán)峻。所以希望找到一種通用的、自動化程度高的、可應(yīng)用于不同數(shù)據(jù)模型和應(yīng)用領(lǐng)域的綜合的匹配方法。本文概要介紹了模式匹
3、配問題及其應(yīng)用,詳細(xì)地闡述了實現(xiàn)模式匹配的不同方法以及它們所應(yīng)用的結(jié)構(gòu)。針對已有模式匹配方法的局限性,本著最大限度地減少人工干預(yù)使模式匹配盡可能做到自動化的原則,本文提出一種利用模式結(jié)構(gòu)信息和已有匹配知識的模式匹配模型SMGM。SMGM模型(SchemaMatchingGraphBasedModel)借鑒神經(jīng)元理論,采用智能推理機(jī)制,結(jié)合啟發(fā)式思想,有效地實現(xiàn)了模式匹配和已有匹配知識的融合,提高了匹配模型的準(zhǔn)確度。SMGM模型主要由初始匹配矩陣模型、結(jié)構(gòu)化語義推理模型、已知匹配知識重用模型、匹配知識自適應(yīng)迭代模型、閾值
4、確定策略和匹配類型選擇策略組成。本模型首先參照輔助信息庫將模式元素分離成詞條向量,并基于向量匹配計算模型計算各模式元素間的匹配度,進(jìn)而生成初始匹配矩陣。結(jié)構(gòu)化語義匹配推理模型是SMGM的核心,是模擬神經(jīng)元相互影響作用的語義推導(dǎo)模型。其基于匹配知識重用模型重用歷史知識,基于高收斂閾值確定模型策略確定最終閾值,并基于匹配類型選擇策略確定模式元素之間的最終匹配關(guān)系,進(jìn)而獲得最終的匹配結(jié)果。隨后模式匹配知識庫中的模式匹配知識被組織成圖結(jié)構(gòu),基于自適應(yīng)迭代模型,對模式匹配知識進(jìn)行精化和深入挖掘,為結(jié)構(gòu)化語義匹配推理和閩值區(qū)間自動
5、縮減等操作提供快速準(zhǔn)確的指導(dǎo)。實驗表明:SMGM模型達(dá)到了預(yù)期目標(biāo)。關(guān)鍵詞:模式匹配;重用;閾值區(qū)間;神經(jīng)網(wǎng)絡(luò);自學(xué)習(xí)一II—東北大學(xué)碩士學(xué)位論文AbstraetResearchOilSchemaMatchingModelBasedonSchemaStructuresandKnownMatchingKnowledgeAbstractInlargedatabaseapplications,suchasWeb_odenteddataintegration,e-g沁inmerce,datawarehouse,database
6、design,theyareallrequiredtousethescheInainformation.Oneofthebasicoperationsisthematchingactivity,whichtakestwoschemasasinputandgeneratesthemappingofthecorrespondingelementsfromtwoschemas.Schemamatchingwasworkedfurdataintegrationbefore.Inrecentyears,theemergenceo
7、fe.commercefurtherpromotestheresearchofschemamatchingtechnique.ine-commerceapplicationsitisalsoneededtorealizethedataconversionbetweendifferentinformationsystemsbyschemamatching.Therearestillmanyproblemsinschemamatchingtechnology,mostoftheexistingschemamatchingm
8、odelsarebasedonartificialworkdefinition(expertsinthefieldorsystemdeveloper),it’Stime—consuminganderror-proneeffort.Theproblembecomesmoreseverewiththerapidincreaseofwe