資源描述:
《關(guān)聯(lián)規(guī)則的相關(guān)算法研究-基于apriori和_fp-growth算法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、學(xué)校代碼:10491研究生學(xué)號(hào):中國(guó)地質(zhì)大學(xué)碩士學(xué)位論文關(guān)聯(lián)規(guī)則的相關(guān)算法研究-基于Apriori和FP-growth算法碩士生:學(xué)科專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:二○一○年五月學(xué)校代碼:10491研究生學(xué)號(hào):中國(guó)地質(zhì)大學(xué)碩士學(xué)位論文關(guān)聯(lián)規(guī)則的相關(guān)算法研究-基于Apriori和FP-growth算法碩士生:學(xué)科專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:二○一○年五月學(xué)校代碼:10491研究生學(xué)號(hào):中國(guó)地質(zhì)大學(xué)碩士學(xué)位論文關(guān)聯(lián)規(guī)則的相關(guān)算法研究-基于Apriori和FP-growth算法碩士生:學(xué)科專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:二○一○年五月學(xué)校代碼
2、:10491研究生學(xué)號(hào):中國(guó)地質(zhì)大學(xué)碩士學(xué)位論文關(guān)聯(lián)規(guī)則的相關(guān)算法研究-基于Apriori和FP-growth算法碩士生:學(xué)科專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:二○一○年五月ADissertationSubmittedtoChinaUniversityofGeosciencesfortheMasterDegreeofComputerSoftwareandTheoryResearchonAssociationRulesMiningAlgorithm-baseonAprioriandFP-growthMasterCandidate:LIANGWei
3、Major:ComputerSoftwareandTheorySupervisor:SUNBinChinaUniversityofGeosciencesWuhanP.R.China中國(guó)地質(zhì)大學(xué)(武漢)研究生學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:本人所呈交的碩士學(xué)位論文《關(guān)聯(lián)規(guī)則的相關(guān)算法研究-基于Apriori和FP-growth算法》,是本人在導(dǎo)師的指導(dǎo)下,在中國(guó)地質(zhì)大學(xué)(武漢)攻讀碩士學(xué)位期間獨(dú)立進(jìn)行研究工作所取得的成果。論文中除已注明部分外不包含他人已發(fā)表或撰寫(xiě)過(guò)的研究成果,對(duì)論文的完成提供過(guò)幫助的有關(guān)人員已在文中說(shuō)明并致以謝意。本人所呈交的
4、碩士學(xué)位論文沒(méi)有違反學(xué)術(shù)道德和學(xué)術(shù)規(guī)范,沒(méi)有侵權(quán)行為,并愿意承擔(dān)由此而產(chǎn)生的法律責(zé)任和法律后果。學(xué)位論文作者(簽字):日期: 年 月 日作者簡(jiǎn)介梁偉,男,壯族,1976年1月出生于廣西壯族自治區(qū)崇左市。2008年9月進(jìn)入中國(guó)地質(zhì)大學(xué)(武漢)信息工程學(xué)院攻讀碩士學(xué)位,專業(yè)為計(jì)算機(jī)軟件與理論,研究方向?yàn)閿?shù)據(jù)庫(kù)技術(shù)和數(shù)據(jù)挖掘。至今已經(jīng)修完全部課程,共計(jì)15門(mén)課程,其中學(xué)位課程10門(mén),選修課程5門(mén),各門(mén)課程成績(jī)合格,總學(xué)分為28分,各科平均成績(jī)?yōu)?2分。在碩士研究生學(xué)習(xí)階段,認(rèn)真學(xué)習(xí)專業(yè)知識(shí),閱讀大量專業(yè)文獻(xiàn),以第一作者在公開(kāi)刊物發(fā)表論文兩篇:
5、△《關(guān)聯(lián)規(guī)則算法探討》-企業(yè)技術(shù)開(kāi)發(fā)(CN43-1172/TB,2009.10)△《基于MYSQL的SQL注入問(wèn)題研究》-科教導(dǎo)刊(CN42-1795/N,2009.12)關(guān)聯(lián)規(guī)則的相關(guān)算法研究-基于Apriori和FP-growth算法碩士生:梁偉導(dǎo)師:孫斌摘要數(shù)據(jù)挖掘是當(dāng)今人工智能和數(shù)據(jù)庫(kù)研究方面最富活力的領(lǐng)域。數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的知識(shí)的過(guò)程。關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘是數(shù)據(jù)挖掘的一個(gè)主要研究?jī)?nèi)容,而如何快速發(fā)現(xiàn)頻繁項(xiàng)集是關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法的核心問(wèn)題。本文討論了數(shù)據(jù)挖掘和關(guān)聯(lián)規(guī)則的一般理論,包括數(shù)據(jù)挖掘的概念、任務(wù)、模式以
6、及數(shù)據(jù)挖掘的應(yīng)用和發(fā)展趨勢(shì)。深入研究了關(guān)聯(lián)規(guī)則挖掘算法,分析了關(guān)聯(lián)規(guī)則挖掘中經(jīng)典的Apriori和FP-growth算法,并總結(jié)了Apriori和FP-growth算法中存在的問(wèn)題。針對(duì)Apriori算法的效率問(wèn)題,從兩個(gè)角度進(jìn)行改進(jìn):(1)降低候選項(xiàng)目集中候選項(xiàng)產(chǎn)生的數(shù)量;(2)減少掃描數(shù)據(jù)庫(kù)的次數(shù)。給出了一種較為高效的關(guān)聯(lián)規(guī)則挖掘算法。算法的主要思想是在掃描數(shù)據(jù)庫(kù)的同時(shí)把支持每個(gè)項(xiàng)目的事務(wù)都標(biāo)記出來(lái),采用一種新的方法生成所有的頻繁集。該算法只需對(duì)源數(shù)據(jù)庫(kù)進(jìn)行一次掃描就可以找出所有的頻繁集,并通過(guò)裁剪候選集的方法達(dá)到減少候選項(xiàng)數(shù)目集的目的。
7、這樣做不但降低了算法的I/O負(fù)荷,而且減少了時(shí)間開(kāi)銷,具有很高的效率。最后,將基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘改進(jìn)算法方法應(yīng)用到學(xué)生考試成績(jī)管理中,對(duì)挖掘結(jié)果進(jìn)行了分析,并提出了指導(dǎo)意見(jiàn)。本文的工作雖然取得了一定的成果,但尚有大量問(wèn)題有待于進(jìn)一步研究,比如,關(guān)聯(lián)規(guī)則挖掘應(yīng)用系統(tǒng)的設(shè)計(jì);關(guān)聯(lián)規(guī)則有趣度的研究以及如何將挖掘結(jié)果友好地呈現(xiàn)給用戶。關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則頻繁集支持度可信度ResearchonAssociationRulesMiningAlgorithm-baseonAprioriandFP-growthMasterCandidate:LIAN
8、GWeiSupervisor:SUNBinABSTRACTDataMiningisoneofthemostactiveresearchfields,especial