SPSS聚類(lèi)分析

SPSS聚類(lèi)分析

ID:40270507

大小:883.00 KB

頁(yè)數(shù):5頁(yè)

時(shí)間:2019-07-30

SPSS聚類(lèi)分析_第1頁(yè)
SPSS聚類(lèi)分析_第2頁(yè)
SPSS聚類(lèi)分析_第3頁(yè)
SPSS聚類(lèi)分析_第4頁(yè)
SPSS聚類(lèi)分析_第5頁(yè)
資源描述:

《SPSS聚類(lèi)分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。

1、SPSS聚類(lèi)分析_詳解SPSS聚類(lèi)分析——一個(gè)案例演示聚類(lèi)分析全過(guò)程案例數(shù)據(jù)源:有20種12盎司啤酒成分和價(jià)格的數(shù)據(jù),變量包括啤酒名稱(chēng)、熱量、鈉含量、酒精含量、價(jià)格。數(shù)據(jù)來(lái)自《SPSSforWindows統(tǒng)計(jì)分析》data11-03。點(diǎn)擊下載【一】問(wèn)題一:選擇那些變量進(jìn)行聚類(lèi)?——采用“R型聚類(lèi)”1、現(xiàn)在我們有4個(gè)變量用來(lái)對(duì)啤酒分類(lèi),是否有必要將4個(gè)變量都納入作為分類(lèi)變量呢?熱量、鈉含量、酒精含量這3個(gè)指標(biāo)是要通過(guò)化驗(yàn)員的辛苦努力來(lái)測(cè)定,而且還有花費(fèi)不少成本,如果都納入分析的話,豈不太麻煩太浪費(fèi)?所以,有必要對(duì)4個(gè)變量進(jìn)行降維處理,這里采用spssR型聚類(lèi)(變量聚類(lèi)),對(duì)4

2、個(gè)變量進(jìn)行降維處理。輸出“相似性矩陣”有助于我們理解降維的過(guò)程。2、4個(gè)分類(lèi)變量量綱各自不同,這一次我們先確定用相似性來(lái)測(cè)度,度量標(biāo)準(zhǔn)選用pearson系數(shù),聚類(lèi)方法選最遠(yuǎn)元素,此時(shí),涉及到相關(guān),4個(gè)變量可不用標(biāo)準(zhǔn)化處理,將來(lái)的相似性矩陣?yán)锏臄?shù)字為相關(guān)系數(shù)。若果有某兩個(gè)變量的相關(guān)系數(shù)接近1或-1,說(shuō)明兩個(gè)變量可互相替代。3、只輸出“樹(shù)狀圖”就可以了,個(gè)人覺(jué)得冰柱圖很復(fù)雜,看起來(lái)沒(méi)有樹(shù)狀圖清晰明了。從proximitymatrix表中可以看出熱量和酒精含量?jī)蓚€(gè)變量相關(guān)系數(shù)0.903,最大,二者選其一即可,沒(méi)有必要都作為聚類(lèi)變量,導(dǎo)致成本增加。至于熱量和酒精含量選擇哪一個(gè)作為典

3、型指標(biāo)來(lái)代替原來(lái)的兩個(gè)變量,可以根據(jù)專(zhuān)業(yè)知識(shí)或測(cè)定的難易程度決定。(與因子分析不同,是完全踢掉其中一個(gè)變量以達(dá)到降維的目的。)這里選用酒精含量,至此,確定出用于聚類(lèi)的變量為:酒精含量,鈉含量,價(jià)格?!径繂?wèn)題二:20中啤酒能分為幾類(lèi)?——采用“Q型聚類(lèi)”1、現(xiàn)在開(kāi)始對(duì)20中啤酒進(jìn)行聚類(lèi)。開(kāi)始不確定應(yīng)該分為幾類(lèi),暫時(shí)用一個(gè)3-5類(lèi)范圍來(lái)試探。Q型聚類(lèi)要求量綱相同,所以我們需要對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化,這一回用歐式距離平方進(jìn)行測(cè)度。2、主要通過(guò)樹(shù)狀圖和冰柱圖來(lái)理解類(lèi)別。最終是分為4類(lèi)還是3類(lèi),這是個(gè)復(fù)雜的過(guò)程,需要專(zhuān)業(yè)知識(shí)和最初的目的來(lái)識(shí)別。我這里試著確定分為4類(lèi)。選擇“保存”,則在數(shù)據(jù)區(qū)

4、域內(nèi)會(huì)自動(dòng)生成聚類(lèi)結(jié)果?!救繂?wèn)題三:用于聚類(lèi)的變量對(duì)聚類(lèi)過(guò)程、結(jié)果又貢獻(xiàn)么,有用么?——采用“單因素方差分析”1、聚類(lèi)分析除了對(duì)類(lèi)別的確定需討論外,還有一個(gè)比較關(guān)鍵的問(wèn)題就是分類(lèi)變量到底對(duì)聚類(lèi)有沒(méi)有作用有沒(méi)有貢獻(xiàn),如果有個(gè)別變量對(duì)分類(lèi)沒(méi)有作用的話,應(yīng)該剔除。2、這個(gè)過(guò)程一般用單因素方差分析來(lái)判斷。注意此時(shí),因子變量選擇聚為4類(lèi)的結(jié)果,而將三個(gè)聚類(lèi)變量作為因變量處理。方差分析結(jié)果顯示,三個(gè)聚類(lèi)變量sig值均極顯著,我們用于分類(lèi)的3個(gè)變量對(duì)分類(lèi)有作用,可以使用,作為聚類(lèi)變量是比較合理的?!舅摹繂?wèn)題四:聚類(lèi)結(jié)果的解釋?zhuān)俊捎谩本当容^描述統(tǒng)計(jì)“1、聚類(lèi)分析最后一步,也是最為困

5、難的就是對(duì)分出的各類(lèi)進(jìn)行定義解釋?zhuān)枋龈黝?lèi)的特征,即各類(lèi)別特征描述。這需要專(zhuān)業(yè)知識(shí)作為基礎(chǔ)并結(jié)合分析目的才能得出。2、我們可以采用spss的means均值比較過(guò)程,或者excel的透視表功能對(duì)各類(lèi)的各個(gè)指標(biāo)進(jìn)行描述。其中,report報(bào)表用于描述聚類(lèi)結(jié)果。對(duì)各類(lèi)指標(biāo)的比較來(lái)初步定義類(lèi)別,主要根據(jù)專(zhuān)業(yè)知識(shí)來(lái)判定。這里到此為止。以上過(guò)程涉及到spss層次聚類(lèi)中的Q型聚類(lèi)和R型聚類(lèi),單因素方差分析,means過(guò)程等,是一個(gè)很不錯(cuò)的多種分析方法聯(lián)合使用的案例。數(shù)據(jù)源和部分介紹均摘自《SPSSforWindows統(tǒng)計(jì)分析》書(shū)中。

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。