spss聚類分析結果解釋ppt課件.ppt

spss聚類分析結果解釋ppt課件.ppt

ID:50749434

大?。?.03 MB

頁數:84頁

時間:2020-03-13

spss聚類分析結果解釋ppt課件.ppt_第1頁
spss聚類分析結果解釋ppt課件.ppt_第2頁
spss聚類分析結果解釋ppt課件.ppt_第3頁
spss聚類分析結果解釋ppt課件.ppt_第4頁
spss聚類分析結果解釋ppt課件.ppt_第5頁
資源描述:

《spss聚類分析結果解釋ppt課件.ppt》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。

1、第14章聚類分析與判別分析介紹:1、聚類分析2、判別分析分類學是人類認識世界的基礎科學。聚類分析和判別分析是研究事物分類的基本方法,廣泛地應用于自然科學、社會科學、工農業(yè)生產的各個領域。114.1.1聚類分析根據事物本身的特性研究個體分類的方法,原則是同一類中的個體有較大的相似性,不同類中的個體差異很大。根據分類對象的不同,分為樣品(觀測量)聚類和變量聚類兩種:樣品聚類:對觀測量(Case)進行聚類(不同的目的選用不同的指標作為分類的依據,如選拔運動員與分課外活動小組)變量聚類:找出彼此獨立且有代表性的自變量,而又不丟失大部分

2、信息。在生產活動中不乏有變量聚類的實例,如:衣服號碼(身長、胸圍、褲長、腰圍)、鞋的號碼。變量聚類使批量生產成為可能。214.1.2判別分析判別分析是根據表明事物特點的變量值和它們所屬的類,求出判別函數。根據判別函數對未知所屬類別的事物進行分類的一種分析方法。在自然科學和社會科學的各個領域經常遇到需要對某個個體屬于哪一類進行判斷。如動物學家對動物如何分類的研究和某個動物屬于哪一類、目、綱的判斷。不同:判別分析和聚類分析不同的在于判別分析要求已知一系列反映事物特征的數值變量的值,并且已知各個體的分類(訓練樣本)。314.1.3聚

3、類分析與判別分析的SPSS過程在Analyze?Classify下:K-MeansCluster:觀測量快速聚類分析過程HierarchicalCluster:分層聚類(進行觀測量聚類和變量聚類的過程Discriminant:進行判別分析的過程414.2快速樣本聚類過程(QuickCluster)使用k均值分類法對觀測量進行聚類可使用系統(tǒng)的默認選項或自己設置選項,如分為幾類、指定初始類中心、是否將聚類結果或中間數據數據存入數據文件等??焖倬垲悓嵗?P342,data14-01a):使用系統(tǒng)的默認值進行:對運動員的分類(分為4類

4、)Analyze?Classify?K-MeansClusterVariables:x1,x2,x3LabelCaseBy:noNumberofCluster:4比較有用的結果:聚類結果形成的最后四類中心點(FinalClusterCenters)和每類的觀測量數目(NumberofCasesineachCluster)但不知每個運動員究竟屬于哪一類?這就要用到Save選項514.2快速樣本聚類過程(QuickCluster)中的選項使用快速聚類的選擇項:類中心數據的輸入與輸出:Centers選項輸出數據選擇項:Save選項聚

5、類方法選擇項:Method選項聚類何時停止選擇項:Iterate選項輸出統(tǒng)計量選擇項:Option選項614.2指定初始類中心的聚類方法例題P343數據同上(data14-01a):以四個四類成績突出者的數據為初始聚類中心(種子)進行聚類。類中心數據文件data14-01b(但缺一列Cluster_,不能直接使用,要修改)。對運動員的分類(還是分為4類)Analyze?Classify?K-MeansClusterVariables:x1,x2,x3LabelCaseBy:noNumberofCluster:4Center:R

6、eadinitialfrom:data14-01bSave:Clustermembership和DistancefromClusterCenter比較有用的結果(可將結果與前面沒有初始類中心比較):聚類結果形成的最后四類中心點(FinalClusterCenters)每類的觀測量數目(NumberofCasesineachCluster)在數據文件中的兩個新變量qc1_1(每個觀測量最終被分配到哪一類)和qc1_2(觀測量與所屬類中心點的距離)714.3分層聚類(HierarchicalCluster)分層聚類方法:分解法:先

7、視為一大類,再分成幾類凝聚法:先視每個為一類,再合并為幾大類可用于觀測量(樣本)聚類(Q型)和變量聚類(R型)一般分為兩步(自動,可從Paste的語句知道,P359):Proximities:先對數據進行的預處理(標準化和計算距離等)Cluster:然后進行聚類分析兩種統(tǒng)計圖:樹形圖(Dendrogram)和冰柱圖(Icicle)各類型數據的標準化、距離和相似性計算P348-354定距變量、分類變量、二值變量標準化方法p353:ZScores、Range-1to1、Range0to1等814.3.4用分層聚類法進行觀測量聚類實

8、例P358對20種啤酒進行分類(data14-02),變量包括:Beername(啤酒名稱)、calorie(熱量)、sodium(鈉含量)、alcohol(酒精含量)、cost(價格)Analyze→Classify→HierarchicalCluster:Variable

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯系客服處理。