基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法.pdf

基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法.pdf

ID:52352846

大?。?49.59 KB

頁數(shù):4頁

時間:2020-03-26

基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法.pdf_第1頁
基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法.pdf_第2頁
基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法.pdf_第3頁
基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法.pdf_第4頁
資源描述:

《基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法.pdf》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。

1、204年第6期s。i。。dT}}j{。。R。。hdoi:10.3969/j.issn.1000—7695.2014.06.038基于布爾矩陣的高價值度關聯(lián)規(guī)則挖掘算法葉世綺,孫振,趙站(暨南大學,廣東廣州510632)摘要:傳統(tǒng)的挖掘算法Apriori是依據(jù)統(tǒng)計學中的數(shù)據(jù)顯著性挖掘關聯(lián)規(guī)則,需多次掃描數(shù)據(jù)庫,效率較低,且忽視了數(shù)據(jù)顯著性與價值性不匹配的問題。針對“大數(shù)據(jù)”下容易產(chǎn)生數(shù)量繁多但無效的關聯(lián)規(guī)則,通過采用基于布爾矩陣挖掘關聯(lián)規(guī)則的算法,只掃描一次數(shù)據(jù)庫,得出布爾矩陣及相應的利潤矩陣,隨后根據(jù)“二八法則”設定

2、對客戶最具吸引力的“最小價值度”,最終挖掘出高價值的關聯(lián)規(guī)則,從而提高規(guī)則挖掘的效率及價值。關鍵詞:關聯(lián)規(guī)則;布爾矩陣;規(guī)則相關項布爾矩陣;平均利潤矩陣;最小價值度中圖分類號:TP301文獻標志碼:A文章編號:1000—7695(2014)06—0188—04High——valueDegreeAssociationRulesMiningAlgorithmBasedonBooleanmatrixYEShiqi,SUNZhen,ZHAOZhe(JinanUniversity,Guangzhou510632,China)A

3、bstract:ThetraditionalassociationrulesminingalgorithmAprioriisbasedonthesignificantminingassociationrulesinstatistics.ThealgorithmisIneficientbecauseitneedstorepeatedlyscanthedatabase.Anditalsoneglectstheproblemthatthesignificanceofdatadoesnotmatchthevalue.Oppo

4、sitelyitiseasytoproduceexcessivebutInvalidassociationrules.Thepaperusesthealgorithmbasedonbooleanmatrixtominingassociationrules.Thisalgorithmdrawsthebool—eanmatrixandthecorrespondingprofitmatrixbyscanningthedatabaseonlyonce.Then,itsetsthemostattractiveminimalde

5、greefortheclientbasedontheParetorule.Atlast,itminesthehigh—valuedegreeassociationrulesandimproveseffi—ciencyandvalue.Keywords:associationrules;booleanmatrix;booleanmatrixrelatedwiththeitemsoftherules;averageprofitmatrix;minimaldegree關聯(lián)規(guī)則挖掘主要用于發(fā)現(xiàn)數(shù)據(jù)庫中客戶感興到對客戶真正具有

6、高價值的關聯(lián)規(guī)則,在已有的研趣的項集之問的相互關聯(lián),是對一個對象和其它對究和實踐的基礎上,本文通過引入有關布爾矩陣的象的相互依存和關聯(lián)關系的一種表示-41。作為數(shù)概念,構(gòu)建布爾矩陣及相應的利潤矩陣,最終得到據(jù)挖掘中的一個重要研究領域,關聯(lián)規(guī)則得到了學具有高價值的關聯(lián)規(guī)則。術界極大的關注,并在商業(yè)、企業(yè)、過程控制、政1相關概念的描述府部門及科學研究等領域都得到了廣泛的應用J。關聯(lián)規(guī)則的典型算法Apriori是Agrawal等人令,={i,i,?,i}為項目集合,由11,個在1993年提出來的,該模型需要不斷地掃描事務數(shù)

7、互不相同的項目構(gòu)成;D為數(shù)據(jù)庫,由一組事務組據(jù)庫,成本較高J,并假定數(shù)據(jù)庫中的項目具有相成;事務T=(,)是一個元組,其中表示同的重要性。在實際的應用中,關聯(lián)規(guī)則的挖掘事務標識符,,,。主要通過支持度和置信度兩個指標來評價一個規(guī)則定義l:令,={,i:,?,i}為項目集合,是否有效J。通過這種方法挖掘關聯(lián)規(guī)則主要存在事務的項集為,={,i:,?,i},且其中涉及著以下問題:首先,支持度和置信度的設定往往過到關聯(lián)規(guī)則的k一項項集為Ix={i,i,?,i},于主觀,容易造成挖掘效果不夠理想;其次,R且k≤≤n,,,P={

8、,p:,?,}表示Agrawal等人。。提出的模型假定數(shù)據(jù)庫中的項目具對應于k一項項集,中k一項單位利潤集,Q=有相同的重要性,容易造成對價值原則的忽視;最{g,g,?,}為整個事務數(shù)據(jù)庫D中對應k一后,需要不斷地掃描事務數(shù)據(jù)庫產(chǎn)生候選集的效率項項集中k一項銷售數(shù)量集,Vx={VV?,較低。為了更加有效地挖掘高價值度關聯(lián)規(guī)則,找收稿日期:201

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。