資源描述:
《基于大數(shù)據(jù)的用戶行為預(yù)測》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于天池數(shù)據(jù)的用戶行為分析報告摘要電商每天都面臨著大量的用戶訪問行為數(shù)據(jù)信息,這些看似零散的數(shù)據(jù),其實隱藏著巨大的商業(yè)邏輯。本報告基于阿里巴巴集團的大數(shù)據(jù)科研平臺——“天池”中的4月15日至8月15日這四個月之間的用戶行為數(shù)據(jù),分別從用戶角度和品牌角度對這些數(shù)據(jù)進行了數(shù)據(jù)描述,數(shù)據(jù)相關(guān)分析、聚類分析、預(yù)測分析。【關(guān)鍵詞】:大數(shù)據(jù);相關(guān)分析;聚類分析目錄1前言32數(shù)據(jù)介紹33數(shù)據(jù)分析43.1描述統(tǒng)計分析43.1.1用戶行為描述統(tǒng)計4表3.1用戶行為統(tǒng)計表43.1.2關(guān)于品牌的用戶行為描述統(tǒng)計4表3.2關(guān)于品牌的用戶行為統(tǒng)計
2、表4表3.3被購買排名前十的品牌53.2相關(guān)分析63.2.1用戶行為的相關(guān)分析6表3.4用戶行為相關(guān)性分析63.2.2關(guān)于品牌的用戶行為的相關(guān)分析7表3.5關(guān)于品牌的用戶行為相關(guān)性分析73.3聚類分析83.3.1用戶行為的聚類分析8表3.6用戶購買次數(shù)分組統(tǒng)計83.3.2關(guān)于品牌的用戶行為的聚類分析9表3.6最終聚類中心93.4預(yù)測分析93.4.1簡單模型預(yù)測9表3.7購買時間模型描述10表3.8購買時間模型統(tǒng)計量104總結(jié)10表3.1用戶行為統(tǒng)計表5表3.2關(guān)于品牌的用戶行為統(tǒng)計表5表3.3被購買排名前十的品牌6表3.
3、4用戶行為相關(guān)性分析7表3.5關(guān)于品牌的用戶行為相關(guān)性分析8表3.6用戶購買次數(shù)分組統(tǒng)計9表3.6最終聚類中心10表3.7購買時間模型描述11表3.8購買時間模型統(tǒng)計量11圖3.1用戶購買次數(shù)圖10圖3.2在4月15日到8月15日之間用戶購物次數(shù)圖11圖3.3以星期為周期的購買模型121前言這幾年,電商的價格戰(zhàn)打得不亦樂乎,繼去年的“雙11大促”和“6·18狂歡節(jié)”之后,電商之間以價格為主要訴求的大規(guī)模促銷層出不窮,幾乎要把所有能夠用來造勢的節(jié)日都用上了,就今年5月份來說,不僅有“五一瘋狂促”、“母親節(jié)活動促銷”,還有“
4、520促銷”,即使不是節(jié)日,電商們?nèi)杂袑映霾桓F的名目來促銷。而消費者們作為這場游戲中的弱者,不斷地被這些真假價格戰(zhàn)挑逗著和引導(dǎo)著。然而,在當今的商場上,還有另外一類企業(yè)不是通過簡單粗暴的價格戰(zhàn),而是通過對數(shù)據(jù)的充分使用和挖掘而在商戰(zhàn)中獲勝的。電商每天都面臨著大量的用戶訪問行為數(shù)據(jù)信息,這些看似零散的數(shù)據(jù),其實隱藏著巨大的商業(yè)邏輯,哪些品牌吸引到了這些受眾?哪些用戶是有潛力客戶?訪問行為數(shù)據(jù)的分析評估隨著電商行業(yè)競爭趨勢的加強,電商在數(shù)據(jù)處理能力上的強弱已經(jīng)成為發(fā)展核心命脈,電商期待通過數(shù)據(jù)挖掘?qū)㈦娚叹W(wǎng)站的用戶、內(nèi)容、營銷
5、進行有效的連接,既能數(shù)據(jù)化客觀地評估和分析營銷的效果,又能發(fā)掘出真正潛在的客戶。合作伙伴通過這類數(shù)據(jù)分析,就能獲悉自己的產(chǎn)品在各區(qū)域、各時間段、各消費群的詳細情況,進而判斷市場趨勢,有的放矢地刺激用戶需求。2數(shù)據(jù)介紹本報告中使用的數(shù)據(jù)來自于阿里巴巴集團的“天池”,一共有條數(shù)據(jù),數(shù)據(jù)真是有效,記錄了用戶在4月15日到8月15日這4個月之間在天貓的行為日志,其中涉及到884位天貓用戶,涉及到的天貓品牌有9531個。用戶行為分為4類,其中“0”代表“點擊”,“1”代表“購買”,“2”代表收藏,“3”代表加購物車。表2.1大數(shù)據(jù)
6、的內(nèi)容名稱記錄內(nèi)容user_id用戶brand_id品牌號type用戶操作行為visit_datetime用戶行為發(fā)生時間本報告期望通過對這些數(shù)據(jù)進行有效的分析和挖掘,了解用戶的品牌偏好,并預(yù)測他們在將來一個月內(nèi)對品牌下商品的操作行為。3數(shù)據(jù)分析3.1描述統(tǒng)計分析3.1.1用戶行為描述統(tǒng)計表3.1用戶行為統(tǒng)計表購買點擊收藏加購物車總計N884884884884884極差83237652112406極小值00001極大值83237652112407合計69841204153均值7.9197.441.360.17206.88
7、0.3167.5930.1480.0267.817標準差9.401225.7694.4070.775232.425方差88.37550971.74619.4180.60154021.507偏度2.8712.8456.0237.1052.7630.0820.0820.0820.0820.082峰度13.72714.11445.81366.78113.2560.1640.1640.1640.1640.164由表3.1可知,用戶在次訪問行為中,居首位的是點擊,達次,接著依次是購買、收藏、加購物車,分別達6984、1204、15
8、3次。說明大部分用戶對網(wǎng)絡(luò)購物比較克制,購買前會經(jīng)過多次點擊瀏覽。購物車的使用率不高,只有及少數(shù)的人使用購物車,造成這種情況主要是因為購物車的作用只是讓多件商品交易過程變得更簡單,不用賣家修改郵費,節(jié)省賣家的時間,但是對于買家來說一則是不長買多件商品,二是使用購物車對買家沒有實質(zhì)性的實惠和幫助,所以購物車對買家的吸引