資源描述:
《分布式關(guān)聯(lián)規(guī)則挖掘若干算法研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、南京師范大學(xué)碩士學(xué)位論文分布式關(guān)聯(lián)規(guī)則挖掘若干算法研究姓名:韋素云申請(qǐng)學(xué)位級(jí)別:碩士專(zhuān)業(yè):計(jì)算數(shù)學(xué)(計(jì)算機(jī)應(yīng)用)指導(dǎo)教師:吉根林20060401南京師范大學(xué)2006年碩士學(xué)位論文摘要隨著數(shù)據(jù)庫(kù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,許多大型數(shù)據(jù)庫(kù)都以分布式形式存在.如何從分布式數(shù)據(jù)庫(kù)中挖掘有價(jià)值的知識(shí)是一個(gè)具有挑戰(zhàn)性的研究課題。關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的核心任務(wù)之一.它在金融、電信、保險(xiǎn)業(yè),市場(chǎng)營(yíng)銷(xiāo)、異常監(jiān)測(cè)、網(wǎng)絡(luò)安全、科學(xué)決策等方面具有十分重要的應(yīng)用價(jià)值.因此受到研究人員的高度重視。本文就約束性關(guān)聯(lián)規(guī)則分布式
2、挖掘與更新、模糊數(shù)量關(guān)聯(lián)規(guī)則分布式挖掘,面向XML數(shù)據(jù)的關(guān)聯(lián)規(guī)則分布式挖掘、關(guān)聯(lián)規(guī)則的冗余刪除與聚類(lèi),關(guān)聯(lián)規(guī)則可視化等方面作了較深入的研究.本文的主要研究工作包括以下幾個(gè)方面;(1)引入向?qū)Ъ母拍睿岢隽嗣嫦蛉郑植磕J降姆植际郊s束性頻繁項(xiàng)目集挖掘算法DeAR,包括局部約束性頻繁項(xiàng)目集挖掘算法CLF和全局約束性頻繁項(xiàng)目集挖掘算法CGF,為用戶(hù)在分布式數(shù)據(jù)庫(kù)中挖掘感興趣的關(guān)聯(lián)規(guī)則提供新的方法.(2)提出了面向全局.局部模式的約束性頻繁項(xiàng)目集的分布式更新算法DUCAR。包括局部約束性頻繁項(xiàng)目集更新
3、算法UCLF和全局約束性頻繁項(xiàng)目集更新算法UCGFt為在分布式數(shù)據(jù)庫(kù)更新情況下快速挖掘約束性關(guān)聯(lián)規(guī)則提供新的途徑.(3)利用模糊集理論,提出了一種基于聚類(lèi)構(gòu)造模糊集及相應(yīng)隸屬度函數(shù)的算法FAM·在此基礎(chǔ)上提出了模糊敖量關(guān)聯(lián)規(guī)則挖掘算法FAR,考慮在分布式環(huán)境中利用分布式聚類(lèi)構(gòu)造全局模糊集和全局隸屬度函數(shù)的算法GFAM,實(shí)現(xiàn)模糊數(shù)量關(guān)聯(lián)規(guī)則分布式挖掘.(4)提出了從XMI.,數(shù)據(jù)中快速挖掘頻繁模式的增量式算法Freqffree,對(duì)分布式數(shù)據(jù)庫(kù)環(huán)境中面向XML數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘問(wèn)題進(jìn)行研究.(5)針對(duì)
4、關(guān)聯(lián)規(guī)則挖掘中存在大量冗余規(guī)則的問(wèn)題,提出了關(guān)聯(lián)規(guī)則的冗余刪除算法ADRR,關(guān)聯(lián)規(guī)則的聚類(lèi)算法ACAR,從而方便用戶(hù)對(duì)關(guān)聯(lián)規(guī)則進(jìn)行分析.(6)提出了關(guān)聯(lián)規(guī)則可視化的一種新方法ARVir,利用Java3D技術(shù)實(shí)現(xiàn)了基于ARVir的關(guān)聯(lián)規(guī)則可視化系統(tǒng)原型,方便用戶(hù)對(duì)結(jié)果進(jìn)行觀察和分析.(7)實(shí)現(xiàn)分布式關(guān)聯(lián)規(guī)則挖掘原型系統(tǒng)DDMINER,驗(yàn)證各個(gè)算法的正確性,測(cè)試各個(gè)算法的性能,實(shí)驗(yàn)結(jié)果表明本文提出的各個(gè)算法是有效可行的,且具有較高的效率.關(guān)鍵詞:分布式數(shù)據(jù)挖掘,關(guān)聯(lián)規(guī)則.全局頻繁項(xiàng)目集。項(xiàng)約束,XML
5、??梢暬┠暇煼洞髮W(xué)2006年嬡士學(xué)位論文Withtheincreasingapplicationofdatabaseandnetworktechnology,manydistributed出It嗣婦揖踏腫produced.itisagrinchallenge10Pjcofminingtheusefulknowledgefromdistributeddatabasesfordacision-making.Distributeddataminingispracticalforuseinmanyfi
6、eldssuch∞finance,telecommunication,insurancebusiness,marketanalysis。anomalydetection,networksccurity,sciencedecision,andsoOILAssnci撕oilruleminingisoneofco嵋data-miningtasksandhasattractedtremendousinterestamongresearchers.Thispaperstudiesondistributedm
7、iningandupdatingofassociationruleswithitemconstraints,distributedminingfuzzyquantitativeassociationrules,miningassociationrulesindistributedXMLdatas,pruningandclusteringdiscoveredassociationmlesandvisualizingassociationrules.11磚mainconlfibutionsofthep
8、aperamlisted舔follows.(1)Introduce8con∞ptofinductedset,thefastalgorithmDCARforminingc,onstrainedassociationrulesindistributedsystemsamproposed,whichincludesefficientaIgori