歡迎來到天天文庫
瀏覽記錄
ID:40230686
大?。?88.00 KB
頁數:28頁
時間:2019-07-27
《第7講 聚類分析與判別分析》由會員上傳分享,免費在線閱讀,更多相關內容在行業(yè)資料-天天文庫。
1、SPSS統計分析從基礎到實踐(第2版)聯系Email:sharepub@126.com第7講聚類分析與判別分析7.1K-均值聚類分析聚類分析簡介做什么?把沒有分類信息的資料按照相似程度歸類怎么做?系統聚類法和非系統聚類法K-均值聚類法基本原理K均值聚類法迭代終止條件兩次迭代計算的聚心之間距離的最大改變量小于初始聚心間最小距離的?倍到達迭代次數的上限K均值聚類的優(yōu)缺點優(yōu)點:占有內存少、計算量小、處理速度快,特別適合大樣本的聚類分析缺點:1、應用范圍有限,要求用戶指定分類數目;2、只能對觀測量聚類,而不能對變量聚類;
2、3、所使用的聚類變量必須都是連續(xù)性變量。利用如下數據將以下城市按照空氣指標分類執(zhí)行【Analyze】/【Classify】/【K-meansCluster】命令,彈出如圖所示對話框結果解讀初始聚類中心表迭代史表6次終止迭代最終聚類中心表7.2系統聚類法系統聚類法的基本思想是:視觀測量(或者變量)各自成為一類;找性質最接近的兩個類合并成一個新類,計算在新的類別分劃下各類之間的距離;再將性質最接近的兩類合并,直到所有模式聚成一類為止。系統聚類法優(yōu)點:既可以對觀測量也可以對變量進行聚類;所使用的變量既可以是連續(xù)變量也可
3、以是分類變量;提供的距離計算方法和結果顯示方法也很豐富。觀測量聚類:按照交通情況對各地進行聚類執(zhí)行【Analyze】/【Classify】/【HierarchicalCluster】命令,彈出如圖所示的對話框結果解讀聚類進度表龍骨圖變量聚類:按照日照數對月份進行聚類結果解讀聚類進度表垂直冰柱圖從下往上看龍骨圖7.3判別分析——Discriminant過程判別分析簡介干什么?判別樣品所屬類型的一種統計方法與聚類分析的關系相同點:解決分類問題不同點:判別分析是在已知研究對象分成若干類型,對未知類型的樣品進行判別分類判
4、別分析的一般步驟常用判別法距離判別法:根據已知分類的數據,分別計算各類的均值(重心),判別準則是任給一次觀測,若它與第i類的重心距離最近,就認為它來自第i類?!糇⒁猓壕嚯x一般采用馬氏距離;距離判別適合對自變量均為連續(xù)變量的情況進行分類;距離判別對各類的分布無特定的要求。Fisher判別法:借助方差分析的思想構造一個判別函數,其中判別系數的確定原則是使得類間的區(qū)別最大,而且類內的離差最小,利用判別函數計算出待判樣品的判別指標,然后與判別臨界值進行比較,判別它的類屬。Fisher判別對各類分布、方差都沒有限制。但當總
5、體個數較多時,計算比較麻煩。Bayes判別法:在考慮先驗概率的前提下,利用Bayes公式計算樣品來自第i類的后驗概率,使用錯判損失最小的概念作判別準則,建立判別函數,將待判樣品歸入來自概率最大類。Bayes判別主要用于多類判別,它要求總體呈多元正態(tài)分布.逐步判別法:逐步判別法與逐步回歸法的基本思想類似,都是逐步引入變量,每引入一個“最重要”的變量進入判別式,同時也考慮較早引入判別式的某些變量,若其判別能力不顯著了,應及時從判別式中剔除去,直到判別式中沒有不重要的變量需要剔除,且也沒有重要的變量要引入為止。利用表格
6、中的數據判斷待判國家的人口發(fā)展水平結果解讀感謝您的關注
此文檔下載收益歸作者所有