資源描述:
《分布式關聯(lián)規(guī)則挖掘若干算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、南京師范大學碩士學位論文分布式關聯(lián)規(guī)則挖掘若干算法研究姓名:韋素云申請學位級別:碩士專業(yè):計算數(shù)學(計算機應用)指導教師:吉根林20060401南京師范大學2006年碩士學位論文摘要隨著數(shù)據(jù)庫和計算機網絡技術的廣泛應用,許多大型數(shù)據(jù)庫都以分布式形式存在.如何從分布式數(shù)據(jù)庫中挖掘有價值的知識是一個具有挑戰(zhàn)性的研究課題。關聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的核心任務之一.它在金融、電信、保險業(yè),市場營銷、異常監(jiān)測、網絡安全、科學決策等方面具有十分重要的應用價值.因此受到研究人員的高度重視。本文就約束性關聯(lián)規(guī)則分布式
2、挖掘與更新、模糊數(shù)量關聯(lián)規(guī)則分布式挖掘,面向XML數(shù)據(jù)的關聯(lián)規(guī)則分布式挖掘、關聯(lián)規(guī)則的冗余刪除與聚類,關聯(lián)規(guī)則可視化等方面作了較深入的研究.本文的主要研究工作包括以下幾個方面;(1)引入向導集的概念.提出了面向全局.局部模式的分布式約束性頻繁項目集挖掘算法DeAR,包括局部約束性頻繁項目集挖掘算法CLF和全局約束性頻繁項目集挖掘算法CGF,為用戶在分布式數(shù)據(jù)庫中挖掘感興趣的關聯(lián)規(guī)則提供新的方法.(2)提出了面向全局.局部模式的約束性頻繁項目集的分布式更新算法DUCAR。包括局部約束性頻繁項目集更新
3、算法UCLF和全局約束性頻繁項目集更新算法UCGFt為在分布式數(shù)據(jù)庫更新情況下快速挖掘約束性關聯(lián)規(guī)則提供新的途徑.(3)利用模糊集理論,提出了一種基于聚類構造模糊集及相應隸屬度函數(shù)的算法FAM·在此基礎上提出了模糊敖量關聯(lián)規(guī)則挖掘算法FAR,考慮在分布式環(huán)境中利用分布式聚類構造全局模糊集和全局隸屬度函數(shù)的算法GFAM,實現(xiàn)模糊數(shù)量關聯(lián)規(guī)則分布式挖掘.(4)提出了從XMI.,數(shù)據(jù)中快速挖掘頻繁模式的增量式算法Freqffree,對分布式數(shù)據(jù)庫環(huán)境中面向XML數(shù)據(jù)的關聯(lián)規(guī)則挖掘問題進行研究.(5)針對
4、關聯(lián)規(guī)則挖掘中存在大量冗余規(guī)則的問題,提出了關聯(lián)規(guī)則的冗余刪除算法ADRR,關聯(lián)規(guī)則的聚類算法ACAR,從而方便用戶對關聯(lián)規(guī)則進行分析.(6)提出了關聯(lián)規(guī)則可視化的一種新方法ARVir,利用Java3D技術實現(xiàn)了基于ARVir的關聯(lián)規(guī)則可視化系統(tǒng)原型,方便用戶對結果進行觀察和分析.(7)實現(xiàn)分布式關聯(lián)規(guī)則挖掘原型系統(tǒng)DDMINER,驗證各個算法的正確性,測試各個算法的性能,實驗結果表明本文提出的各個算法是有效可行的,且具有較高的效率.關鍵詞:分布式數(shù)據(jù)挖掘,關聯(lián)規(guī)則.全局頻繁項目集。項約束,XML
5、??梢暬┠暇煼洞髮W2006年嬡士學位論文Withtheincreasingapplicationofdatabaseandnetworktechnology,manydistributed出It嗣婦揖踏腫produced.itisagrinchallenge10Pjcofminingtheusefulknowledgefromdistributeddatabasesfordacision-making.Distributeddataminingispracticalforuseinmanyfi
6、eldssuch∞finance,telecommunication,insurancebusiness,marketanalysis。anomalydetection,networksccurity,sciencedecision,andsoOILAssnci撕oilruleminingisoneofco嵋data-miningtasksandhasattractedtremendousinterestamongresearchers.Thispaperstudiesondistributedm
7、iningandupdatingofassociationruleswithitemconstraints,distributedminingfuzzyquantitativeassociationrules,miningassociationrulesindistributedXMLdatas,pruningandclusteringdiscoveredassociationmlesandvisualizingassociationrules.11磚mainconlfibutionsofthep
8、aperamlisted舔follows.(1)Introduce8con∞ptofinductedset,thefastalgorithmDCARforminingc,onstrainedassociationrulesindistributedsystemsamproposed,whichincludesefficientaIgori