資源描述:
《關(guān)聯(lián)規(guī)則挖掘算法研究 (2)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、”一?-一?!罦O墜321分婁號::!!!!密級:——單位代甭馬:】Q3§2學(xué)號:唑!!!竺!!竺17侖船工學(xué)大警HefeiUniversityofTechnology碩士學(xué)位論文MASTERDISS電RTATIoNo論文題目:關(guān)聯(lián)規(guī)則挖掘算法研究學(xué)位類別:學(xué)科專業(yè):(工程領(lǐng)域作者姓名:導(dǎo)師姓名:完成時間:學(xué)歷碩士管理科學(xué)與工程李偉東倪志偉教授2007年5月關(guān)聯(lián)規(guī)則挖掘算法研究摘要關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘領(lǐng)域中的一個非常重要的研究內(nèi)容,其主要目標(biāo)就是發(fā)現(xiàn)數(shù)據(jù)庫中一組對象之間某種有趣關(guān)聯(lián)或相關(guān)聯(lián)系。近年來,關(guān)聯(lián)規(guī)則挖掘研
2、究成為數(shù)據(jù)挖掘中的一個熱點,并被廣泛應(yīng)用于市場營銷、事務(wù)分析等領(lǐng)域。本文對經(jīng)典關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行了系統(tǒng)的研究和全面的總結(jié),在此基礎(chǔ)上提出了新的關(guān)聯(lián)規(guī)則挖掘及更新算法。首先,本文介紹了數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則挖掘的基本知識和一些經(jīng)典的關(guān)聯(lián)規(guī)則算法。然后,針對FP—Growth算法的不足,本文從數(shù)據(jù)結(jié)構(gòu)與挖掘方法兩個方面進(jìn)行改進(jìn),提出了基于ICFP.樹的頻繁模式挖掘算法QMFI.ICFP。該算法減少了FP.樹所占用的內(nèi)存,節(jié)省了條件模式樹生成所耗的時間。實驗表明該算法比FP—Growth算法具有更好的性能。最后,論文對在支持
3、度和數(shù)據(jù)庫增加同時發(fā)生變化的情況下,如何快速更新關(guān)聯(lián)規(guī)則的問題進(jìn)行了詳細(xì)的分析研究,提出了一種基于矩陣的關(guān)聯(lián)規(guī)則更新算法IUBM,并對該算法進(jìn)行了分析和討論。與其他算法相比,該算法僅需掃描一遍新增的數(shù)據(jù)庫db,因此該算法具有較高的效率。關(guān)鍵詞:數(shù)據(jù)挖掘:關(guān)聯(lián)規(guī)則;FP.樹;矩陣;增量更新TheResearchontheAlgorithmsofMiningAssociationRulesAbstractAsoneoftheimportantcontentsindatamining,associationrulemini
4、ngaimstodiscovertheinterestingconnectionorthecorrelationmidstasetofobjectsinadatabase.Associationrulemininghasbecomeahotresearchtopicinrecentyears,andithasbeenusedwidelyinselectivemarketing,decisionanalysisandbusinessmanagement.Inthethesis,someclassicalalgorith
5、msforminingassociationruleshavebeensystematicallystudiedandcomprehensivelysummarized.Onthebasicofpreviousresearch,thenovelalgorithmsforminingassociationrulesandincrementalupdatingofassociationrulesareproposed.Firstly,thethesisintroducessomebasicknowledgeofdatam
6、iningandassociationrulesandsomeclassicalalgorithmsforassociationrules.Secondly,thethesisanalysesthedisadvantageofFP—Growth.Takingmeasuresfromdatastructureandminingmeans,anovelalgorithmforminingfrequentpatternsbasedonimprovedcompressedFP-tree,i.e.QMFI·ICFP,ispro
7、ved.ThisalgorithmsaveslargememoryspaceoccupiedbyFP-treeandthecostofconstructingmanyconditionalFP-trees.ExperimentsshowthatthetimeandspaceforQMFI-ICFPhavereducedsignificantlycomparedtoFP—growthmining.Finally,anewincrementalupdatingalgorithmbasedonmatrixformainta
8、iningdiscoveredassociationrules,i.e.IUBM,usedwhenthetransactiondatabaseincreasesandtheminimumsupportchanges,ispresentedinthethesis.Someanalysistothenewalgorithmispresented.C