基于BDIF的關聯(lián)規(guī)則挖掘算法研究-論文.pdf

基于BDIF的關聯(lián)規(guī)則挖掘算法研究-論文.pdf

ID:53028235

大?。?92.75 KB

頁數(shù):3頁

時間:2020-04-14

基于BDIF的關聯(lián)規(guī)則挖掘算法研究-論文.pdf_第1頁
基于BDIF的關聯(lián)規(guī)則挖掘算法研究-論文.pdf_第2頁
基于BDIF的關聯(lián)規(guī)則挖掘算法研究-論文.pdf_第3頁
資源描述:

《基于BDIF的關聯(lián)規(guī)則挖掘算法研究-論文.pdf》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。

1、第37卷第2期唐山師范學院學報2015年3月)1.37No.2JournalofTangshanNormalUniversityMar2015基于BDIF的關聯(lián)規(guī)則挖掘算法研究郭昌建(合肥學院計算機科學與技術系,安徽合肥230601)摘要:闡述了關聯(lián)規(guī)則挖掘的研究情況,關聯(lián)規(guī)則的分類方法等,對經(jīng)典Apriori算法進行了分析和評價,在此基礎上提出了一種高效產(chǎn)生頻繁集的BDIF(BasedTransactionalDatabasesIncludingFrequentItemSet)算法;它通過劃分數(shù)據(jù)塊,快速的搜尋頻繁項目集,從而減少對數(shù)據(jù)塊的掃描次數(shù),提

2、高了算法的效率并用BorlandC++Builder6.0開發(fā)環(huán)境來調(diào)試、驗證該算法關鍵詞:數(shù)據(jù)挖掘;關聯(lián)規(guī)則;BDIF中圖分類號:TP391.1文獻標識碼:A文章編號:1009.9115(2015)02—0042—03D0I:1O.3969~.issn.1009—9115.2015.02.013OntheMiningAlgorithmBasedonBDIFAssoeiationRuleGUOChang-jian(DepartmentofComputerScienceandTechnology,HefeiUniversity,Hefei230601,Ch

3、ina)Abstract:ThisarticledescribesresearchonassociationruleminingandClassificationmethodsofassociationrules,analyzesandevaluatestheclassicApriorialgorithm,whichgivesrisetoaneficientfrequentBDIF(BasedTransactionalDatabasesIncludingFrequentItemSet)algorithm.Ittherebyreducesscanningd

4、atablockandimprovesalgorithmeficiencybydividingdatablockandquicklysearchingforfrequentitemset.KeyWords:datamining;associationrules;basedtransactionaldatabasesincludingfrequentitemset隨著經(jīng)濟的發(fā)展和信息的增長,許多企業(yè)和組織積的研究人員對關聯(lián)規(guī)則的挖掘問題進行了大量的研究。累了大量的數(shù)據(jù),隱含在數(shù)據(jù)中的關聯(lián)規(guī)則、模式等知包括對關聯(lián)規(guī)則挖掘的理論探索、原有的算法的改進和識是對決

5、策有幫助的信息。數(shù)據(jù)挖掘的目的就是發(fā)現(xiàn)隱新算法的設計、并行關聯(lián)規(guī)則挖掘等問題【2]。含在數(shù)據(jù)中對決策有幫助的信息,它是實現(xiàn)智能決策支1.1關聯(lián)規(guī)則的基本概念持系統(tǒng)的一個重要手段。數(shù)據(jù)挖掘是從大量的、不完全設I={il,..,i}是二進制文字的集合,其中的元的、有噪聲的、模糊的、隨機的數(shù)據(jù)集中識別有效的、素稱為項(item),其中(k=-I,2?.,m)可以是購物籃新穎的、潛在有用的,以及最終可理解的模式的非平凡中的物品,也可以是保險公司的顧客。設任務相關的數(shù)過程”。據(jù)D是事務集(DB),其中每個事務是項集,使得l關聯(lián)規(guī)則挖掘綜述T_cl。這里沒有考慮事務

6、中項的數(shù)量,也就是說項是山關聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最活躍的研究方法之一個二進制的變量來表示它是否在事務中出現(xiàn)。每個事一。關聯(lián)規(guī)則是發(fā)現(xiàn)交易數(shù)據(jù)庫中不同商品(項)之間務都有一個相關的標識符或TID。(設是‘個項集,的聯(lián)系,這些規(guī)則找出顧客購買行為模式,如購買了某且)關聯(lián)規(guī)則是如下形式的邏輯蘊涵:==>口,At1,一商品對購買其他商品的影響。發(fā)現(xiàn)這樣的規(guī)則可以應Bd,且n=。關聯(lián)規(guī)則具有支持度和置信度兩個用于商品貨架設計、貨存安排以及根據(jù)購買模式對用戶重要的屬性L3J。進行分類。最早是由Agrawal等人提出的。之后有諸多1.2關聯(lián)規(guī)則的分類基金項目:合肥學

7、院重點建設學科(2014xk08)收稿日期:2014.09.02作者簡介:郭昌建(1965.),男,安徽合肥人,碩士,副教授,研究方向為計算機網(wǎng)絡、人工智能。.42.郭昌建:基于BDIF的關聯(lián)規(guī)則挖掘算法研究關聯(lián)規(guī)則按不同情況可分為:(1)基于規(guī)則中處理開始計)。根據(jù)該順序,排列相應的事務集Txl。的變量的類別:關聯(lián)規(guī)則可分為布爾型和數(shù)值型;(2)3.1.2搜尋包含最大頻繁項集的事務集基于規(guī)則中數(shù)據(jù)的抽象層次:可以分為單層關聯(lián)規(guī)則和經(jīng)過第一步后,利用以上推論,掃描包含頻繁1一多層關聯(lián)規(guī)則;(3)基于規(guī)則中涉及到的數(shù)據(jù)的維數(shù):項集的事務集Txl。若P為數(shù)據(jù)

8、庫D中的項目數(shù),為避關聯(lián)規(guī)則可分為單維的和多維的l4】。免重復產(chǎn)生相同的事務集,

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。