資源描述:
《關(guān)聯(lián)規(guī)則挖掘相關(guān)算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、西南交通大學(xué)碩士學(xué)位論文關(guān)聯(lián)規(guī)則挖掘相關(guān)算法研究姓名:毛艷慧申請學(xué)位級別:碩士專業(yè):計算機應(yīng)用技術(shù)指導(dǎo)教師:陶宏才20090601西南交通大學(xué)碩士研究生學(xué)位論文第1頁摘要數(shù)據(jù)挖掘技術(shù)是近年來數(shù)據(jù)庫和人工智能等領(lǐng)域研究的熱點課題,它引起了科學(xué)界和產(chǎn)業(yè)界的廣泛關(guān)注。在數(shù)據(jù)挖掘技術(shù)發(fā)展繁榮的大背景下,關(guān)聯(lián)規(guī)則技術(shù)得到了蓬勃發(fā)展,并正朝更為廣泛而深入的方向繼續(xù)發(fā)展。關(guān)聯(lián)規(guī)則挖掘作為數(shù)據(jù)挖掘領(lǐng)域的一個重要研究分支,它的任務(wù)是發(fā)現(xiàn)所有滿足支持度閾值和置信度閾值的強關(guān)聯(lián)規(guī)則。近年來,關(guān)聯(lián)規(guī)則挖掘研究己經(jīng)成為數(shù)
2、據(jù)挖掘中的一個熱點,并被廣泛應(yīng)用于市場營銷、事務(wù)分析等應(yīng)用領(lǐng)域。關(guān)聯(lián)規(guī)則挖掘算法是關(guān)聯(lián)規(guī)則挖掘研究的主要內(nèi)容,迄今為止己提出了許多高效的關(guān)聯(lián)規(guī)則挖掘算法。本文對關(guān)聯(lián)規(guī)則挖掘進行了系統(tǒng)的分析與研究,并在已有研究的基礎(chǔ)上提出了兩個改進算法。論文的主要工作如下:(1)對關(guān)聯(lián)規(guī)則挖掘的基本理論進行了總體研究,包括關(guān)聯(lián)規(guī)則挖掘的基本概念、分類、挖掘過程、改善關(guān)聯(lián)規(guī)則挖掘質(zhì)量的主要策略等,并在此基礎(chǔ)上分析了關(guān)聯(lián)規(guī)則的擴充問題,從而指出關(guān)聯(lián)規(guī)則挖掘的研究方向。(2)對關(guān)聯(lián)規(guī)則經(jīng)典算法Apdori作了全面的分析
3、,指出了挖掘中的關(guān)鍵步驟并提出算法的不足,并分析總結(jié)了二進制算法和矩陣算法的相關(guān)研究,提出了一種基于頻繁項集矩陣的關(guān)聯(lián)規(guī)則挖掘算法。該算法不需要生成頻繁候選項集,并且只需要掃描事務(wù)數(shù)據(jù)庫一次,采用頻繁項集矩陣存儲事務(wù)數(shù)據(jù)并對其約簡,占用的存儲空間也少得多。理論分析和測試實驗證明了新算法在性能上的優(yōu)越性。(3)研究并分析了頻繁模式增長算法FP.growth,結(jié)合用戶訪問模式的特點,提出了一種新的用戶訪問模式挖掘算法AP.mining。該算法將Web用戶的會話集映射為一棵訪問模式樹,然后在訪問模式樹
4、上挖掘頻繁訪問模式并生成模式數(shù)組,最后在模式數(shù)組中找到所有的頻繁訪問模式。利用挖掘出來的模式知識,可以更好地對Web站點進行設(shè)計與維護。關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法;頻繁項集矩陣;FP.growth算法用戶頻繁訪問模式西南交通大學(xué)碩士研究生學(xué)位論文第1I頁AbstractDamminingtechnologyhasbeenahottaskinthefieldofdatabaseandartifieialintelligenceinrecentyears,andattracted
5、extensiveattentionsfromscienceandindustry.Nowadays,intheprosperousbackgroundofdataminingtechnology,associationrulestechnologyobtainsthevigorousdevelopment.Associationruleminingisanimportantsub-branchofthedatamining,whichtaskistodiscoverassociationrul
6、essatisfyingbothaminimumsupportthresholdandminimumconfidencethreshold.Associationrulemininghasbecomeahotresearchtopicinrecentyears,andhasbeenusedwidelyinmarketingandtransactionanalysis.Associationruleminingalgorithmsarethecorecontentsinthearea.Sofar,
7、manyfamousalgorithmsofassociationruleshavebeenproposed.Thisthesishassystemicallyanalyzedandresearchedassociationrulemining,andputsforwardtwoimprovedalgorithmsonthebasisofexistingresearchwork.Themaintasksinthethesisarcasfollows:(1)Thebasictheoriesfora
8、ssociationruleminingarediscussedsystematicallyinthisthesis,includingthebasicconcepts,classification,miningprocess,thevalueofmeasurement,andonthisbasisananalysisoftheexpansionoftheissueofassociationrules,pointingoutthattheassociationruleminingresearch