資源描述:
《用戶畫像是什么用戶畫像怎么畫.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫(kù)。
1、用戶畫像是什么用戶畫像怎么畫 我們看過(guò)應(yīng)該不下10篇關(guān)于用戶畫像的干貨。但是依舊不知道應(yīng)該怎么做一份用戶畫像出來(lái)。干貨里告訴我們用戶畫像的價(jià)值、用戶畫像應(yīng)該有的數(shù)據(jù),用戶畫像應(yīng)該包含的內(nèi)容。好的,我都按大神們的教導(dǎo)收集好數(shù)據(jù)了。麻煩誰(shuí)能告訴我到!底!這!些!數(shù)!據(jù)!怎!么!處!理!?。∥?! 今天我就拋磚引玉的說(shuō)一下我曾經(jīng)經(jīng)手的一份用戶畫像及其每一步的建立步驟吧!當(dāng)然我覺(jué)得那次的結(jié)果很粗糙,原因在于還是沒(méi)人告訴我每一步要怎么做,但是起碼應(yīng)該是一個(gè)粗線條的步驟原型了。希望今天之后大家能在收集齊全大神的數(shù)據(jù)建議之后,終于知道每步要怎么做了
2、!不要像我一樣,太慘了。step1我們還是要說(shuō)一下數(shù)據(jù)源的事情 雖然我從來(lái)都秉承著能百度到的東西基本不廢話,但是這張圖我覺(jué)得還是有必要貼出來(lái)的。這個(gè)圖不是我的,原文作者:郭志金。知識(shí)產(chǎn)權(quán)還是要保護(hù)的,大家可以百度一下郭老師關(guān)于如何構(gòu)建用戶畫像的文章找到更加詳細(xì)的論述。不多說(shuō)了。上圖。 這里能就是郭老師說(shuō)的需要準(zhǔn)備好的所有的相關(guān)用戶數(shù)據(jù)。好的,我覺(jué)得這些數(shù)據(jù)對(duì)于大家來(lái)說(shuō)并不那么困難吧。所以收集到了之后呢,就開(kāi)始真正的處理數(shù)據(jù)了。step2數(shù)據(jù)收集后的處理步驟第一步:清洗數(shù)據(jù) 本來(lái)我不打算說(shuō)這個(gè),但是覺(jué)得還是有必要提一句,收集到的數(shù)據(jù)
3、很多都不能直接使用。需要對(duì)數(shù)據(jù)進(jìn)行編碼和分類,還要去掉異常值和補(bǔ)全缺失值這些。我這里將會(huì)用到的分析軟件是跟隨我五六年的SPSS(用了這么多年依舊不是高手)。我就假設(shè)這一步大家都做完了。第二步:因素分析 本來(lái)我也不知道為什么要做因素分析。直到我最近看書才了解,給大家解釋一下做因素分析的原因。用戶畫像就是把一堆數(shù)據(jù)分類,分到同一組的數(shù)據(jù)所代表的人就是一類。那么聚類就需要考慮把哪些數(shù)據(jù)拿出來(lái)聚類呢?比如說(shuō)個(gè)人收入和家庭總收入。這是兩列數(shù)據(jù),最后可能都會(huì)決定我是屌絲還是白富美。要把這兩個(gè)數(shù)據(jù)放進(jìn)去一起聚類嗎?恐怕不是!聚類是不建議把高度相關(guān)的數(shù)據(jù)
4、都扔進(jìn)去的。為什么?因?yàn)楦叨认嚓P(guān)了就基本等于同一個(gè)數(shù)據(jù)了,你把同一個(gè)數(shù)據(jù)放進(jìn)去兩遍,不就是加重了這個(gè)數(shù)據(jù)在所有數(shù)據(jù)里的權(quán)重了么!這里一些專業(yè)統(tǒng)計(jì)詞我就不過(guò)分解釋了,這次真的可以百度?! ≈懒藶槭裁匆蛩胤治?,就談?wù)勔蛩胤治龅淖饔?,因素分析就是把N個(gè)數(shù)據(jù)先歸歸類,特別相同的就是一類的了,我們選其中一些數(shù)據(jù)就可以了。這樣因素分析就可以幫我們把N列數(shù)據(jù)減少到幾列數(shù)據(jù)。至于因素分析怎么做,我也不在這里廢話了。有一個(gè)神奇的老師叫吳明隆,他有一本SPSS實(shí)操,那里手把手教學(xué)。各位可以去自行查閱。第三步:相關(guān)分析 我們已經(jīng)把數(shù)據(jù)N列減少到重要的幾個(gè)了
5、。在開(kāi)始聚類之前,還要做一件事就是看一下這些數(shù)據(jù)的相關(guān)性。一般我們選擇中等相關(guān)的數(shù)據(jù)。太相關(guān)不能用原因見(jiàn)上一條。太不相關(guān)了也別放進(jìn)去了,畢竟個(gè)人收入的數(shù)據(jù)和隔壁老王的體重?cái)?shù)據(jù)放在一起也沒(méi)什么大用。相關(guān)分析怎么做也請(qǐng)見(jiàn)吳老師的寶書。第四步:聚類分析 好的,我們終于說(shuō)到我們的主角了,聚類分析。我曾記得當(dāng)初我做的時(shí)候一個(gè)恩師姐姐建議我,聚類都做一遍。雖然我還不懂她在說(shuō)什么。但是就我現(xiàn)在的理解,給大家談一談。首先SPSS里有三種聚類方式。見(jiàn)圖?! ∩厦婵吹嚼?,這是SPSS里的3中聚類方式。我會(huì)首先做一下兩步聚類。為啥呢,因?yàn)閮刹骄垲惒恍枰獎(jiǎng)幽X
6、子。為什么這么說(shuō)。就是你丟一堆數(shù)據(jù)進(jìn)去,你不需要預(yù)設(shè)你要聚類成幾類。就是你可以不知道到底有幾類啊,看SPSS大大的心情啊。兩步聚類把數(shù)據(jù)類型分分開(kāi)就可以了,別把連續(xù)的放在類別的里面。就可以了。聚類之后你會(huì)得到這樣一個(gè)結(jié)果。上圖。 醬紫的。具體的解釋和怎么看。建議去看沈浩老師博客的聚類分析,百度一下你值得擁有。然后我們把一些重要程度很低的變量可以試著剔除一些了。這里就是第一次聚類。第1頁(yè)第2頁(yè)