基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)

基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)

ID:43548744

大?。?.87 MB

頁數(shù):96頁

時間:2019-10-10

基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)_第1頁
基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)_第2頁
基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)_第3頁
基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)_第4頁
基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)_第5頁
資源描述:

《基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在工程資料-天天文庫

1、山東大學碩士學位論文基于矩陣的關聯(lián)規(guī)則挖掘算法的設計與實現(xiàn)姓名:牛小飛申請學位級別:碩士專業(yè):計算機軟件與理論指導教師:石冰山東大學很大的進步,然而,有一幣架中還沒有被發(fā)現(xiàn),如規(guī)則天上漲,四天后下跌的可能我們稱該規(guī)則為事務間關耳;出了挖掘1.維事務間關聯(lián)關鍵字:數(shù)據(jù)挖掘、關聯(lián)規(guī)山東才AbstactDhaetpam?1bn1?1engmor0abundantdataaarchfr0nt■1erw?1nf0rmat■10nscat?10nshaVegre?1mpr0Vedtheabedt0af?1e1dthabr0adpr0spectescr?1besth

2、ec0funct?10n0fdatatam?1n?1ngsystd?1fferencebetpr0gresmu1'pe0srw¥ai?1st?1ngasm?1n?1ngfrMm?10csrt01s■10kfeurdaysafterc0mest?1ngwe?1ntertrec0n.cept■1nter—tp■1r0cessnter—traethnoaaanyroncapacat■亠faeoroeW8io111±1%11o?IXomnKeyWords:DataminiiUpdationassocia日期:本人鄭重聲明:月立進行研究所取得的萬包含任何其他個人

3、或糜究作出重要貢獻的個丿的法彳唸議*X諸基于矩陣由第一章引言1?1課題提f隨著信息技術的迅其主要原因是隨著數(shù)據(jù)黍知俱種類甫例如,則問題【2】,并于199書富弄奚聯(lián)規(guī)則的挖掘問題算法進行優(yōu)化,如引入隨機算法挖掘規(guī)則的效率:有的二Apriori算法的挖掘刁挖掘頻繁項集的FP—Gr(六珈關聯(lián)規(guī)則的挑戰(zhàn)性在于數(shù)扌用內(nèi)存小、L/o操作少、扌關聯(lián)規(guī)則挖凰編加4W標數(shù)據(jù)中客體BI山東大第二章課題研究邸數(shù)據(jù)挖掘(Dat中提取隱含其中、人忙式進行高級處理的遼面關于關聯(lián)規(guī)則的研究2.1數(shù)據(jù)衣2.1.3分類(學會一個分類函數(shù)或分類杉據(jù)項映射到給定類別中的某集),以及基于訓練

4、集中數(shù)成一系列的分類規(guī)則,這些以更好地理解數(shù)據(jù)庫中的每距離度量。2?1?6演彳這可能包括時間相關數(shù)特點包括時間序列分析2o2數(shù)據(jù)挖掘1典型的數(shù)據(jù)挖掘山東大學彳用戶確信方面的知識也可匸模式的興趣度。?數(shù)據(jù)挖掘引擎:這是數(shù)據(jù)挖掘的最重要I成,用于特征化、關聯(lián)、分類?模式評估模塊:通常此成分使用興趣度'以便將搜索聚集在有趣的模:評估模塊也可以與挖掘模塊3對于有效的數(shù)據(jù)挖掘,建議丿搜索限制在有興趣的模式上。概括說來,數(shù)據(jù)非的本質(zhì)區(qū)別是數(shù)據(jù)挖掘據(jù)挖掘所得到的信息應是指該信息是預先未預或知識,甚至是違背直賢有價值。數(shù)據(jù)挖掘是從現(xiàn)呂數(shù)據(jù)挖掘出現(xiàn)之前早亡準備的數(shù)據(jù),這

5、些數(shù)據(jù)第三章ABM算法的理關聯(lián)規(guī)則描述了數(shù)據(jù)庫中,關聯(lián)規(guī)則模式是比較重g出,是數(shù)據(jù)挖掘中一種簡單彳聯(lián)規(guī)則的算法屬于無監(jiān)督學習£3?1關聯(lián)規(guī)則的有:子集設即iT厲項白關聯(lián)151116】山東刁狀況不好,索賠率也木描述關聯(lián)規(guī)則屬I)支持度(S支持度s是Dsuppon(Az,事務中岀跳的概率。例m,有100條,則關聯(lián)夫頻度。滿足最小支持衛(wèi)黑有3)擄?僵山東大學供。例如對一個學校的50顯示:60%的學生(3CN1(2000)既打籃球又匚則“打籃球j吃谷類早餐,,是-2000/3000=665因為總的吃谷類早餐的學生I即避免生感:鯉,旳卿則flB)=P(B山東大是

6、布爾型關聯(lián)規(guī)則;性所以是一個數(shù)值型關聯(lián)2.基于規(guī)則中數(shù);在單層的關聯(lián)規(guī)貝同的層次的;而在多層例如:IBM臺式機==>Sony打印機,ABM算法挖掘的是單整數(shù)弓山東大學TIDItemsetsT1BroadoCoke,CT2Coke,Beerl"3Coke.Mill(T4Bread?Coke.T5Bread?M鹽T6Coke,Mi1kT7Bread.MiIkT8Bread,Coke,hz7n9Bread,Coke山東大on高算法丿皆能就是產(chǎn)生的*上存在著問題。主K)都需要掃描數(shù)昨L2是最耗床山東大學;第一遍,先把數(shù)據(jù)J個部分能夠放入內(nèi)彳項集)。然后匯總j全

7、局支持度,以確;頻繁集至少在一個;想,同樣可以減輕(進行掃描的事務集山東h最小支持度而它們不包當k=2時的性能是一使用哈希函數(shù)h(x,y)=(((£i口~q舌+(ord?t山東大學項,并分別挖掘每個數(shù)據(jù)棒在內(nèi)存中,將原來從磁盤耶比在磁盤中快數(shù)萬倍57..論文[7]對FP—tr,(1)它有一個標記為prefixsubtree)的集合,itable).(2)每個項前綴子樹[1inko_在旌聯(lián)£2頁目集。山東大接后綴。它使用最不頻索開銷。142面給出的數(shù)據(jù)庫0B¥Q7▼3月2)可以被擴WI展為{1,2L”最小支持數(shù)211?z5}也是頻繁3—項集。3,5)都不

8、能再擴展,算法終一圖3.翱瀆駆外推g嘟4山東大第四章基于矩陣的前面我們介紹的纟需要多次掃描數(shù)據(jù)

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。