資源描述:
《關(guān)聯(lián)規(guī)則增量更新算法的研究與應(yīng)用論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、獨(dú)創(chuàng)性聲明IIIIIIUIIIIIIIIIIIIIlY2399110本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得重麼直&電太堂或其他教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意。學(xué)位論文作者簽名:匐ll臣風(fēng)簽字日期:7啦年,月.汀日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解重麼童g電太堂有關(guān)保留、使用
2、學(xué)位論文的規(guī)定,有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱和借閱。本人授權(quán)重麼由&電太堂可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。(保密的學(xué)位論文在解密后適用本授權(quán)書)學(xué)位論文作者簽名:慶IlI國風(fēng)導(dǎo)師簽名:簽字日期:W肛年,月必佃簽字日期:Ⅺ仁年r月∥日重慶郵電大學(xué)碩士論文摘要數(shù)據(jù)挖掘通過從大量數(shù)據(jù)中提取感興趣的知識(shí)、規(guī)律或更高層次的信息,可以有效的解決“數(shù)據(jù)爆炸而信息匱乏”問題。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘領(lǐng)域中一個(gè)重
3、要的研究課題,主要描述事務(wù)數(shù)據(jù)庫中不同項(xiàng)集之間的有趣關(guān)聯(lián)或相互關(guān)系,在電信業(yè)務(wù)、零售業(yè)交易、環(huán)境監(jiān)測、工業(yè)生產(chǎn)、互聯(lián)網(wǎng)服務(wù)等領(lǐng)域中應(yīng)用廣泛。隨著高速數(shù)據(jù)獲取、網(wǎng)絡(luò)通信、數(shù)據(jù)管理等技術(shù)的發(fā)展,時(shí)效性高、動(dòng)態(tài)變化的數(shù)據(jù)不斷聚集,隱藏在其中的關(guān)聯(lián)規(guī)則也必然會(huì)發(fā)生變化。及時(shí)高效的關(guān)聯(lián)規(guī)則更新對于趨勢分析、指揮調(diào)度、輔助決策、信息推薦等具有重要的應(yīng)用價(jià)值?,F(xiàn)有的關(guān)聯(lián)規(guī)則更新算法大多致力于解決增量更新本身,但很少同時(shí)考慮更新時(shí)機(jī),不適于對實(shí)時(shí)應(yīng)用中頻繁更新的數(shù)據(jù)進(jìn)行有效處理。針對此問題,本文提出了一種與時(shí)機(jī)判定相結(jié)
4、合的關(guān)聯(lián)規(guī)則增量更新算法。該算法在改進(jìn)增量更新方法的同時(shí),兼顧對更新時(shí)機(jī)的判定。在關(guān)聯(lián)規(guī)則時(shí)機(jī)判定階段,根據(jù)關(guān)聯(lián)規(guī)則差異度確定關(guān)聯(lián)規(guī)則更新時(shí)機(jī)。在關(guān)聯(lián)規(guī)則增量更新階段,計(jì)算含有非空子集個(gè)數(shù)之和最多的頻繁項(xiàng)集,找出在更新數(shù)據(jù)集中仍然頻繁的項(xiàng)集,根據(jù)Apriori性質(zhì),采用增強(qiáng)的剪枝策略修剪候選項(xiàng)集,減少需要計(jì)算的候選項(xiàng)集,加速關(guān)聯(lián)規(guī)則的更新過程。為驗(yàn)證與時(shí)機(jī)判定相結(jié)合的關(guān)聯(lián)規(guī)則增量更新算法的有效性,本文主要從算法的執(zhí)行時(shí)間和計(jì)算過程中需要存儲(chǔ)的候選項(xiàng)集數(shù)量兩方面進(jìn)行測試。算法分析和實(shí)驗(yàn)結(jié)果表明,通過對更新
5、時(shí)機(jī)的及時(shí)判定和候選項(xiàng)集的有效剪枝,關(guān)聯(lián)規(guī)則的更新效率得以提高。該算法有效應(yīng)用于基于關(guān)聯(lián)規(guī)則的網(wǎng)上購物推薦系統(tǒng)中,可發(fā)現(xiàn)關(guān)聯(lián)規(guī)則能夠隨系統(tǒng)中交易數(shù)據(jù)的變化而及時(shí)更新。關(guān)鍵詞:關(guān)聯(lián)規(guī)則,增量更新,剪枝策略,頻繁項(xiàng)集,推薦系統(tǒng)AbstractDataminingreferstoextractingormininginterestingknowledge,regularitieS,orhigh.1evelinformationfromlargeamountsofdata.Duetotheimminentnee
6、dforturningmassivedataintousefulinformationandknowledge,theimportanceofdataminingisgrowingatrapidpacerecently·Asanimportantresearchtopicinthefieldofdatamining,associationrulesmainlydescribetheinterestingmutualassociationsandcorrelationsamongdifferentitem
7、sinlargetransactionaldatabase.TheassociationsandCOrrelationsgainedcanbeusedforapplicationsrangmgfromtelecommunicationservices,retailtradeandenvironmentmonitoring,toindustrialproductionandInternetservice.Withthedevelopmentofhigh.speeddataacquisition,netwo
8、rkcommunicationsanddatamanagementtechnology,highlytime-sensitiveanddynamicallychangingdataIScontinuouslyadded,asaresultpotentialassociationruleshiddenindatasetsinevitablychange.Therefore,theupdateofassociationruleshasimpor