滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究

滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究

ID:33699775

大?。?.35 MB

頁數(shù):62頁

時間:2019-02-28

滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究_第1頁
滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究_第2頁
滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究_第3頁
滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究_第4頁
滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究_第5頁
資源描述:

《滑動窗口中數(shù)據(jù)流頻繁項集挖掘算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。

1、萬方數(shù)據(jù)獨創(chuàng)性聲明本人聲明所呈交的學位論文是本人在導師指導下進行的研究工作和取得的研究成果,除了文中特別加以標注和致謝之處外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得云洼王業(yè)太堂或其他教育機構的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均己在論文中作了明確的說明并表示了謝意。學位論文作者簽名:萆黃玉簽字日期:z<4s年f月缸日學位論文版權使用授權書本學位論文作者完全了解云蓬工業(yè)太坐有關保留、使用學位論文的規(guī)定。特授權云連工業(yè)太堂可以將學位論文的全部或部分內容編入有關數(shù)據(jù)庫進行檢索,并采用

2、影印、縮印或掃描等復制手段保存、匯編以供查閱和借閱。同意學校向國家有關部門或機構送交論文的復印件和磁盤。(保密的學位論文在解密后適用本授權說明)學位論文作者簽名:覃砷乇、導師簽名:I●JJ一穸彩7茅簽字日期:掃圬年l,El以日簽字日期:如侉年(,El釤日萬方數(shù)據(jù)學位論文的主要創(chuàng)新點一、.針對數(shù)據(jù)流的獨有特點,提出了一種滑動窗口中數(shù)據(jù)流最大頻繁項集挖掘算法。該算法主要采用0-1矩陣作為儲存結構,把事務的相關信息以二進制的形式儲存到事務矩陣中,并通過兩個矩陣的相關操作和子集檢測快速挖掘出最大頻繁項集存儲到數(shù)組MFI中,大大減少了候選項

3、集的產(chǎn)生,進一步提高了挖掘的時間效率。二、一些傳統(tǒng)的數(shù)據(jù)流頻繁閉項集挖掘算法存在搜索空間大和查找效率低的問題,從而造成算法的時間效率較低。針對以上問題,提出了滑動窗口中數(shù)據(jù)流頻繁閉項集挖掘算法DS-MCFI,該算法同樣采用兩個0-1矩陣作為儲存結構,然后通過二項集矩陣擴展得到頻繁k一項集,并通過邏輯與操作得到頻繁k一項集的支持度,再將支持度相等的頻繁項集存儲到數(shù)據(jù)字典結構中來提高算法的查找效率;最后通過挖掘所有支持度相等的頻繁項集中的最大頻繁項集組合生成頻繁閉項集。萬方數(shù)據(jù)摘要I刪吵㈣Y2757321近年來,隨著信息技術的高速發(fā)展

4、,變化多樣的數(shù)據(jù)形式使得傳統(tǒng)的靜態(tài)數(shù)據(jù)挖掘技術己無法適應高速流動的動態(tài)的數(shù)據(jù)挖掘,數(shù)據(jù)挖掘的發(fā)展方向更加深入。數(shù)據(jù)流就是其中最新出現(xiàn)的很重要的數(shù)據(jù)形式,在計算機網(wǎng)絡、傳感器、金融市場、股票交易以及醫(yī)療衛(wèi)生等眾多領域得到了廣泛的應用,因此數(shù)據(jù)流挖掘技術成為了當前研究問題的熱點。作為關聯(lián)規(guī)則的基礎和核心,數(shù)據(jù)流頻繁項集的挖掘更是成為了數(shù)據(jù)流挖掘領域的一個熱點問題。數(shù)據(jù)流最大頻繁項集的項集數(shù)目相對很少并且己隱含所有的頻繁項集,所以數(shù)據(jù)流中最大頻繁項集的挖掘具有很好的時空效率并且有很大的意義,也受到了業(yè)界更多的關注。針對數(shù)據(jù)流最大頻繁項集

5、的挖掘,提出了在滑動窗口中基于矩陣的數(shù)據(jù)流最大頻繁項集挖掘方法SWM-MFI,主要采用兩個矩陣來存儲數(shù)據(jù)信息:一個矩陣是事務矩陣,存儲事務數(shù)據(jù);一個矩陣是二項集矩陣,存放頻繁2一項集。通過二項集矩陣擴展得到頻繁k一項集,基于SwM-MFI算法挖掘出最大頻繁項集。經(jīng)過理論和實驗證明該算法具有很好的時效性。有些傳統(tǒng)的數(shù)據(jù)流頻繁閉項集挖掘算法存在搜索空間大和查找效率低的問題,從而造成算法的時間效率較低。針對以上問題,提出了滑動窗口中數(shù)據(jù)流頻繁閉項集挖掘算法DS—MCFI,首先引入兩個矩陣:一個矩陣是事務矩陣,存儲事務數(shù)據(jù);一個矩陣是二項

6、集矩陣,存放頻繁2一項集;然后通過二項集矩陣擴展得到頻繁k一項集,并通過邏輯與操作得到頻繁k一項集的支持度,兩個矩陣的相關操作可以明顯降低算法的時間復雜度;再將支持度相等的頻繁項集存儲到數(shù)據(jù)字典結構中來提高算法的查找效率;最后通過挖掘所有支持度相等的頻繁項集中的最大頻繁項集組合生成頻繁閉項集。經(jīng)過理論分析和實驗證明,DS-MCFI算法具有很好的時空效率。關鍵詞:數(shù)據(jù)流;數(shù)據(jù)流挖掘;最大頻繁項集;滑動窗口;頻繁閉項集萬方數(shù)據(jù)Inrecentyears,withtherapiddevelopmentofmodeminformation

7、technology,theavarietyofdataformmakesthetraditionalstaticdataminingtechniqueshavebeenunabletoadapttothehigh-speedflowdynamicdatamining.Andthedevelopmentdirectionofdataminingismoredeeply.Datastreamisoneofthelatestimportantformsofdata.Ithasbeenwidelyusedincomputernetwor

8、ks,sensors,financialmarket,stooktrading,medicalandhealth,andmanyotherfields.Sothedatastreamminingtechnologyhasbecomethefocus

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。