資源描述:
《基于權(quán)重的一種apriori改進算法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、湖北工業(yè)大學碩士學位論文摘要數(shù)據(jù)挖掘是從存放數(shù)據(jù)庫、數(shù)據(jù)倉庫或其它信息庫中的大量數(shù)據(jù)中挖掘有趣知識的過程。它包含關(guān)聯(lián)規(guī)則挖掘、預測、分類、聚類、演化分析等多種技術(shù)手段,其中關(guān)聯(lián)規(guī)則挖掘是一種主要的也是用途最廣的數(shù)據(jù)挖掘方法。關(guān)聯(lián)規(guī)則概念最早是由在IBM工作的RakeshAgrawal博士于1993年提出的,用于刻劃事務(wù)數(shù)據(jù)庫中交易項目之間的關(guān)系,即頻繁關(guān)系。其研究己有10余年時間并取得了很多成果,但還有很多問題亟待解決。本文對此作了詳細介紹,并對關(guān)聯(lián)規(guī)則挖掘理論特別是關(guān)聯(lián)規(guī)則挖掘算法進行了研究,取得了一定的研究成果。本文首先介紹了數(shù)據(jù)挖掘的基本概念、存在問題及發(fā)展方向。典次介紹了關(guān)聯(lián)分析的基
2、本概念、分類及一些常見的算法思想,其中著重討論了挖掘關(guān)聯(lián)規(guī)則的經(jīng)典算法-Apriori算法的基本思想,并介紹了旨在提高該算法效率的一些變形算法。最后,針對如Apriori的傳統(tǒng)算法存在的一些問題,提出了一種基于種子項和權(quán)的新算法-AprioriWeight』F算法,并詳細討論了該算法的設(shè)計思路、設(shè)計過程及性能研究。關(guān)鍵詞:數(shù)據(jù)挖掘,關(guān)聯(lián)規(guī)則,Apriori_Weight—MF,基集,權(quán)湖北工業(yè)大學碩士學位論文AbstractDataminingistheprocessofdiscoveringinterestingknowledgefromlargevolumesofdatawhichare
3、storedeitherindatabases,datawarehouses,orotherinformationrepositories.Itincludeslorsoftechnicalmeasuressuchasassociationrulemining,prediction,classification,clusteringandevolutionaryanalysis.Ofthesetechniques,theassociationruleminingtechniqueisthemostimportantandalsothemostwidely—usedmethod.Theconc
4、cDtofassociationruleWasfirstproposedin1993byDr.RakeshAgrawalwhowasworkingatmM.todescribetherelationshipbetweentransactionalitemsintransactiondatabases,thefrequentrelationship.Studiesonthissubjecthavebeencarriedoutformoretha口n10yearsandhavemanyfruits,butmanyproblemsarestillexistingwhichneedurgentres
5、olution.T11ispapergivesadetailedintroductiontOthestudiesofthisa/'eaandmakesani11-deDtllexplorationontheassociationruleminingtheory,withthealgorithmsofassociationrulemininginparticular,thestudyturnsoutsomevaluableresultS.Firstly,inthispaper,Weintroducedthebasicconcept,problemexistedanddevelopmentway
6、;Secondly,weintroducedthebasicconcept,classificationandsomefamiliaralgorithmideasofassociationanalysis.TheideaoftheclassicalalgorithmAprioriiStheemphasisandsomeofitstransformativealgorithmsareintroducedtoimprove山eefficiency.Intheend,tosolvetheproblemsexistedinthetraditionalalgorithmssuchasApriori,a
7、newalgorithmcalledApriori—wei曲t_MFbasedontheseeditemandweightisproposed.Itsdesignidea,designprocessandperformancestudyarediscussedatlarge.Keywords:Datamining,AssociationrulesAprioriWeight_MF,Baseset,WeightⅡ