01-spss軟件聚類分析過程的圖文解釋與結果的全面分析

01-spss軟件聚類分析過程的圖文解釋與結果的全面分析

ID:22071607

大小:583.55 KB

頁數(shù):12頁

時間:2018-10-27

01-spss軟件聚類分析過程的圖文解釋與結果的全面分析_第1頁
01-spss軟件聚類分析過程的圖文解釋與結果的全面分析_第2頁
01-spss軟件聚類分析過程的圖文解釋與結果的全面分析_第3頁
01-spss軟件聚類分析過程的圖文解釋與結果的全面分析_第4頁
01-spss軟件聚類分析過程的圖文解釋與結果的全面分析_第5頁
資源描述:

《01-spss軟件聚類分析過程的圖文解釋與結果的全面分析》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在應用文檔-天天文庫。

1、SPSS聚類分析過程聚類的主要過程一般可分為如下四個步驟:1.數(shù)據(jù)預處理(標準化)2.構造關系矩陣(親疏關系的描述)3.聚類(根據(jù)不同方法進行分類)4.確定最佳分類(類別數(shù))SPSS軟件聚類步驟1.數(shù)據(jù)預處理(標準化)→Analyze(分析)→Classify(分類,歸類)→HierachicalClusterAnalysis(層序聚類分析)→Method(方法,條理,)然后從對話框中進行如下選擇從TransformValues框中點擊向下箭頭,此為標準化方法,將出現(xiàn)如下可選項,從中選一即可:標準化方法解釋:None:不進行標

2、準化,這是系統(tǒng)默認值;ZScores(Z-Scores,英文名又叫StandardizedPopulationData,是以標準差單位來表現(xiàn)的一組觀察值):標準化變換;Range–1to1:極差標準化變換(作用:變換后的數(shù)據(jù)均值為0,極差為1,且

3、xij*

4、<1,消去了量綱的影響;在以后的分析計算中可以減少誤差的產(chǎn)生。);Range0to1(極差正規(guī)化變換/規(guī)格化變換);2.構造關系矩陣在SPSS中如何選擇測度(相似性統(tǒng)計量):→Analyze→Classify→HierachicalClusterAnalysis→Metho

5、d然后從對話框中進行如下選擇常用測度(選項說明):Euclideandistance:歐氏距離(二階Minkowski距離),用途:聚類分析中用得最廣泛的距離;SquaredEucideandistance:平方歐氏距離;Cosine:夾角余弦(相似性測度;Pearsoncorrelation:皮爾遜相關系數(shù);3.選擇聚類方法SPSS中如何選擇系統(tǒng)聚類法常用系統(tǒng)聚類方法a)Between-groupslinkage組間平均距離連接法方法簡述:合并兩類的結果使所有的兩兩項對之間的平均距離最小。(項對的兩成員分屬不同類)特點:非最

6、大距離,也非最小距離b)Within-groupslinkage組內(nèi)平均連接法方法簡述:兩類合并為一類后,合并后的類中所有項之間的平均距離最小C)Nearestneighbor最近鄰法(最短距離法)方法簡述:用兩類之間最遠點的距離代表兩類之間的距離,也稱之為完全連接法d)Furthestneighbor最遠鄰法(最長距離法)方法簡述:用兩類之間最遠點的距離代表兩類之間的距離,也稱之為完全連接法e)Centroidclustering重心聚類法方法簡述:兩類間的距離定義為兩類重心之間的距離,對樣品分類而言,每一類中心就是屬于該類

7、樣品的均值特點:該距離隨聚類地進行不斷縮小。該法的譜系樹狀圖很難跟蹤,且符號改變頻繁,計算較煩。f)Medianclustering中位數(shù)法方法簡述:兩類間的距離既不采用兩類間的最近距離,也不采用最遠距離,而采用介于兩者間的距離特點:圖形將出現(xiàn)遞轉(zhuǎn),譜系樹狀圖很難跟蹤,因而這個方法幾乎不被人們采用。g)Ward’smethod離差平方和法方法簡述:基于方差分析思想,如果分類合理,則同類樣品間離差平方和應當較小,類與類間離差平方和應當較大特點:實際應用中分類效果較好,應用較廣;要求樣品間的距離必須是歐氏距離。譜系分類的確定經(jīng)過系

8、統(tǒng)聚類法處理后,得到聚類樹狀譜系圖,Demirmen(1972)提出了應根據(jù)研究的目的來確定適當?shù)姆诸惙椒?,并提出了一些根?jù)譜系圖來分類的準則:A.任何類都必須在臨近各類中是突出的,即各類重心間距離必須極大B.確定的類中,各類所包含的元素都不要過分地多C.分類的數(shù)目必須符合實用目的D.若采用幾種不同的聚類方法處理,則在各自的聚類圖中應發(fā)現(xiàn)相同的類實例分析SPSS19.0分析軟件聚類分析4.2聚類分析——系統(tǒng)聚類法在數(shù)據(jù)編輯窗口的主菜單中選擇“分析(A)”→“分類(F)”→“系統(tǒng)聚類(H)”(如圖-4所示),彈出“系統(tǒng)聚類分析”

9、對話框,將“地區(qū)”變量選入“標注個案(C)”中,將其他變量選入“變量框”中,如圖-5所示。在“分群”單選框中選中“個案”,表示進行的是Q型聚類。在“輸出”復選框中選中“統(tǒng)計量”和“圖”,表示要輸出的結果包含以上兩項。單擊“統(tǒng)計量(S)”按鈕,在“系統(tǒng)聚類分析:統(tǒng)計量”對話框中選擇“合并進程表”、“相似性矩陣”,如圖-6所示,表示輸出結果將包括這兩項內(nèi)容。單擊“繪制(T)”按鈕,在“系統(tǒng)聚類分析:圖”對話框中選擇“樹狀圖”、“冰柱”,如圖-7所示,表示輸出的結果將包括譜系聚類圖(樹狀)以及冰柱圖(垂直)。單擊“方法(M)”按鈕,

10、彈出“系統(tǒng)聚類分析:方法”對話框,如下圖-8所示。“聚類方法(M)”選項條中可選項包括如圖-9所示的幾種方法,本例中選擇“組間聯(lián)接”:“度量標準-區(qū)間(N)”選項條中可選項包括如圖-10所示的幾種度量方法,本例中選擇“平方Euclidean距離”:“轉(zhuǎn)換值-標準化(S)”選項

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。