資源描述:
《大型超市購物籃問題》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在工程資料-天天文庫。
1、大型超市購物籃問題大型超市“購物籃”分析摘要本文通過對大型超市“購物籃”的分析,運用Apriori算法的思想,做出相應的改進,利用支持度和置信度的大小進行一定程度的篩選,結合商品的利潤大小,引入促銷系數(shù),通過促銷系數(shù)的比較,得到科學的商品組合情況,設計一定的商品促銷手段,實現(xiàn)超市效益的進一步增大。對于問題一,我們參考了一種最有影響的挖掘布爾關聯(lián)規(guī)則頻繁項集的算法一一Apriori算法。用matlab編程,得到每兩個商品同時出現(xiàn)的個數(shù),并求得它們的支持度和相互的置信度,設定最低支持度為5%,得到符合的
2、兩種商品組合數(shù)為17組。設定最低置信度為20%,對17組數(shù)據(jù)進行篩選,得到12組商品組合。最后通過關聯(lián)密切系數(shù)的大小,得到了12組商品組合彼此關聯(lián)關系的密切程度。對于問題二,僅考慮商品支持度的大小,求得在一定最小支持度下被頻繁地同時購買的商品組合。用matlab編程,設置最小支持度為2.12%,篩選兩個商品組合時,我們得到了1391種組合方式,在此基礎上篩選三個商品組合時,我們得到了40種組合方式;再繼續(xù)篩選四個商品組合得到35種,最后篩選五個商品得到一種組合,六個商品組合時則沒有出現(xiàn)大于最小支持度
3、的組合方式。因此,我們得到了盡可能多的商品被頻繁同時購買的信息。對于問題三,在結合商品利潤的條件下,引入促銷系數(shù)H,考慮1391個兩種商品組合中各商品的利潤、支持度和置信度,分別計算出三者的乘積之和進行比較。選取促銷系數(shù)H較高的組合商品采取就近擺放、打折促銷、消費送禮等捆綁銷售方式得到一種促銷方案,使得超市的效益進一步增大。關鍵詞:購物籃分析、Apriori算法、促銷系數(shù)一、問題重述作為超市的經(jīng)理,經(jīng)常關心的問題是顧客的購物習慣。他們想知道:“什么商品組或集合顧客多半會在一次購物時同時購買?”?,F(xiàn)在
4、假設你們是某超市的市場分析員,已經(jīng)掌握了該超市近一個星期的所有顧客購買物品的清單和相應商品的價格,需要你們給超市經(jīng)理一個合理的“購物籃”分析報告,并提供一個促銷計劃的初步方案。問題一:附件1中的表格數(shù)據(jù)顯示了該超市在一個星期內(nèi)的4717個顧客對999種商品的購買記錄,對數(shù)據(jù)進行分析,試建立一種數(shù)學模型,使該模型能定量表達超市中多種商品間的關聯(lián)關系的密切程度。問題二:根據(jù)問題1建立的模型,通過一種快速有效的方法從附件1中的購買記錄中分析出哪些商品是最頻繁被同時購買的,找到的最頻繁被同時購買的商品數(shù)量越
5、多越好。問題三:附件2給出了這999中商品的對應的利潤,根據(jù)在問題1、問題2中建立的模型,設定一種初步的促銷方案,使超市的效益進一步增大。二、模型的假設1、假設各個商品的利潤保持不變。2、假設表格中的數(shù)據(jù)能真實地反映當?shù)叵M者的購物情況。3、假設短時間內(nèi)商品的銷售情況維持穩(wěn)定,不會出現(xiàn)大幅波動。三、符號說明符號sic(A=>B)c(B=>A)cismincminkH解釋說明組合i的支持度規(guī)則A=>B的置信度規(guī)則B=>A的置信度組合i的平均置信度最小支持度最小置信度關聯(lián)密切系數(shù)
6、促銷系數(shù)四、問題分析本題是關于大型超市“購物籃”的分析問題,涉及到數(shù)據(jù)挖掘、關聯(lián)規(guī)則等相關問題。本題的三個問題是層層遞進的關系,要求通過對商品購買數(shù)據(jù)的分析,找到關聯(lián)程度較高且購買次數(shù)較高的商品,最后設計出合理的超市促銷力*案。問題一,由于購物籃分析是關聯(lián)規(guī)則挖掘的一個典型案例,因此我們采用一種最有影響的挖掘布爾關聯(lián)規(guī)則[1]頻繁項集的算法一一Apriori算法[2-3]。利用其基本思想,進行了商品兩種之間的支持度和置信度計算,在定義最小支持度和最小置信度后,進行篩選得到關聯(lián)規(guī)則集。為定量地表達超市
7、屮多種商品間的關聯(lián)關系的密切程度,本文引入一個關聯(lián)密切系數(shù)進行衡量分別對12個組合求解平均置信度,進而得到該組的關聯(lián)密切系數(shù)。由此認為,關聯(lián)密切系數(shù)越大的商品組合,其關聯(lián)關系密切程度較高。問題二,在得到商品兩種關聯(lián)數(shù)裾的基礎上,僅考慮商品支持度的大小,求得在一定最小支持度下被頻繁地同時購買的商品組合。同時為使商品數(shù)量盡量多,我們在兩種組合的情況下延伸至三種組合,四種組合??以此得到盡可能多的商品被頻繁同時購買的信息,盡量靠近最頻繁被同時購買且商品數(shù)量越多的雙重目標。問題三,在結合商品利潤的條件下,考
8、慮兩種組合屮各商品的利潤、支持度和置信度,分別計算出三者的乘積再求和,記為促銷系數(shù)H,并以此作為衡量此組合商品是否進行促銷的標準。當結果較高時,我們就采取就近擺放、打折促銷、消費送禮等捆綁銷售方式式得到一種促銷方案,在方便顧客的購買的同時,增加消費者對該超市的冇好感和信任度,最終使得超市的效益進一步增大。五、模型的建立和求解模型一:基于Apriori算法的關聯(lián)規(guī)則挖掘[4】模型1.模型的準備設:l={il,i2im}是所有項目的集合.D是所有事務的集合(即數(shù)據(jù)庫),每