基于MapReduce的頻繁項集挖掘算法研究-論文.pdf

基于MapReduce的頻繁項集挖掘算法研究-論文.pdf

ID:53028585

大?。?46.37 KB

頁數(shù):5頁

時間:2020-04-14

基于MapReduce的頻繁項集挖掘算法研究-論文.pdf_第1頁
基于MapReduce的頻繁項集挖掘算法研究-論文.pdf_第2頁
基于MapReduce的頻繁項集挖掘算法研究-論文.pdf_第3頁
基于MapReduce的頻繁項集挖掘算法研究-論文.pdf_第4頁
基于MapReduce的頻繁項集挖掘算法研究-論文.pdf_第5頁
資源描述:

《基于MapReduce的頻繁項集挖掘算法研究-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關內容在行業(yè)資料-天天文庫。

1、技術與方法物流技術2015年第34卷4月刊(下半月)doi:lO.3969/j.issn.1005-152X.2015.04(2).047基于MapReduce的頻繁項集挖掘算法研究黃金晶’,葉施仁,何福男’(1.蘇州工業(yè)職業(yè)技術學院信息工程系,江蘇蘇州215104;2.常州大學信息科學與工程學院,江蘇常州213016)【摘要】將MapReduce運用于關聯(lián)規(guī)則挖掘算法中,提出了一種改進的頻繁項集挖掘算法。該算法以并行的方式工作,并且改變了頻繁項集挖掘的次序,從包含項數(shù)最多的頻繁項集開始挖掘,直到得到用戶希望的頻繁項集終止

2、,為用戶提供了交互性,與經(jīng)典的關聯(lián)規(guī)則挖掘算法Apfiori相比,運行效率有大幅度的提高。【關鍵詞】數(shù)據(jù)挖掘;云計算;關聯(lián)規(guī)則;頻繁項集;MapReduce【中圖分類-~-]TP311.13[文獻標i,qr~qlA【文獻編號】10o5—152X(2015)04(2)一0178—04ResearchonFrequentItemSetsMiningAlgorithmBasedonMapReduceHuangJinjing,YeShiren,HeFunan(1.DepartmentofInformationEngineering

3、,SuzhouInstituteofIndustrialTechnology,Suzhou215104;2.SchoolofInformationScience&Engineering,ChangzhouUniversity,Changzhou213016,China)Abstract:Inthispaper,duringtheuseofMapReduceintheassociationruleminingalgorithm,weproposedallimpmvedfrequentitemsetsminingalgorit

4、hmwhichworkedinaparallelwayandchangedthesequenceofminingfrequentitemsets.Startingfromthefrequentitemsetscontainingthemostitems,itworkeduntiltheuserwantedtostop.ComparedwiththeclassicalassociationruleminingalgorithmApriori,itgreat—lyimprovedtheeficiency.Keywords:da

5、tamining;Cloudcomputing;associationrule;frequentitemset;MapReduce一種改進的、基于MapReduce的并行數(shù)據(jù)挖掘和機器學習算1引言法執(zhí)行工具包NIMBLE~。針對關聯(lián)規(guī)則挖掘,也出現(xiàn)了基于MapReduce的改進算法,文獻[5]中詳細介紹了利用MapReduce關聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的重要組成部分,它能找出數(shù)挖掘頻繁閉項集的方法,文獻【6】、[7】分別給出了算法并行化的據(jù)集中項之間的相關聯(lián)系,在金融、電子商務等領域都有廣泛改進思想,不同程度地提高了原有關聯(lián)規(guī)

6、則挖掘算法的運行的應用,如決策制定、商品推薦服務等。在關聯(lián)規(guī)則挖掘的算效率。法中,Apfiofit”、FP-tree算法等都是經(jīng)典的算法。在大數(shù)量級的Apfiofi及其各種改進算法都從頻繁1項集開始挖掘,直情況下,傳統(tǒng)關聯(lián)規(guī)則挖掘算法的性能達不到要求,而并行分到挖出全部的頻繁項集,然而,有時人們更加關注那些包含項布式計算為處理大規(guī)模數(shù)據(jù)提供了可能。Apfiofi算法的目的個數(shù)較多的項集,而不是頻繁1一項集、頻繁2一項集。因而,本是挖掘頻繁項集,本文提出一種基于MapRedueet~31的改進頻繁文給出了一種基于MapRed

7、uce的頻繁項集挖掘算法,改變了項集挖掘算法,提高了對海量數(shù)據(jù)關聯(lián)規(guī)則挖掘的效率。頻繁項集產(chǎn)生的次序,從包含項集最多的頻繁項集開始逐層向下迭代,直至用戶想要的頻繁項集為止,為用戶提供了交互性。2相關研究工作3基于MapReduce的改進頻繁項集挖掘算法隨著對云計算了解的深入,MapReduce編程模型被用于數(shù)據(jù)挖掘,越來越多的算法被改進成能并行化處理的算法。如3.1MapReduce編程框架Ranger等提出了基于MapReduce的應用程序編程接ElMapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集的并行Phoenix,

8、實現(xiàn)了K-Means等數(shù)據(jù)挖掘的算法。IBM研究院提出運算,由Go0gle公司提出。利用MapReduce模型,程序員可以【收稿日期]2015一O1—29【基金項目】國家自然科學基金資助項目(61272367/F020511)【作者簡介】黃金晶,講師,主要研究方向:數(shù)據(jù)挖掘;葉施仁,副教授,博士;何福男

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。