SPSS聚類分析.ppt

SPSS聚類分析.ppt

ID:49518583

大?。?.23 MB

頁數(shù):42頁

時間:2020-02-06

SPSS聚類分析.ppt_第1頁
SPSS聚類分析.ppt_第2頁
SPSS聚類分析.ppt_第3頁
SPSS聚類分析.ppt_第4頁
SPSS聚類分析.ppt_第5頁
資源描述:

《SPSS聚類分析.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、第三講聚類分析1聚類分析的基本思想聚類分析是根據(jù)“物以類聚”的道理,對樣品或指標進行分類的一種多元統(tǒng)計分析方法,它們討論的對象是大量的樣品,要求能合理地按各自的特性來進行合理的分類?;舅枷胧歉鶕?jù)事物本身的特性研究個體分類的方法;聚類原則是同一類中的個體有較大的相似性,不同類中的個體差異很大。2相似性度量進行“相關(guān)性”或“相似性”度量。在相似性度量中常常包含有許多主觀上的考慮,但是最重要的是考慮指標性質(zhì)或觀測的尺度。當樣品進行聚類時,“靠近”往往是距離。同時對指標進行聚類時,根據(jù)相關(guān)系數(shù)或某種關(guān)聯(lián)性度量來聚類。Q型聚類統(tǒng)計量

2、(距離)3、明考斯基距離(Minkowski)1、絕對距離(Block距離)2、歐氏距離(Euclideandistance)可以驗證,dij(q)滿足距離的四條公理。但距離的大小與各指標的觀測單位有關(guān);而且沒有考慮指標之間的相關(guān)性。改進的辦法:4、切比雪夫距離(Chebychev)1、標準化變換2、蘭氏距離3、馬氏距離5.數(shù)據(jù)的標準化6、蘭氏距離7、馬氏距離例1已知一正態(tài)總體G的分布為求點和至均值的距離.由假設(shè)可算得從而如果用歐氏距離而按馬氏距離相差19倍.點A和點B的密度分別是f(1,1)=0.2157和f(1,-1)=

3、0.00001658說明前者應(yīng)當離均值較近,后者較遠.例2歐洲各國的語言有許多相似之處,有的十分相似。為了研究這些語言的歷史關(guān)系,也許通過比較他們數(shù)字的表達式比較恰當。表列舉出英語,挪威語,丹麥語,荷蘭語,德語,法語,西班牙語,意大利語,波蘭語,匈牙利語和芬蘭語的1,2,…,10的拼法,希望計算這11種語言之間的語言的距離.英語挪威語丹麥語荷蘭語德語法語西班牙語OneeneneeneinununoTwotototweezweideuxdosThreetretredriedrietriostresFourfirefirevie

4、rvierquatrecuatroFivefemfermvifjfunfeinqcinoSixsekssekszessechssixseixSevensjusyvzevensiebcnseptsieteEightateoteacheachthuitochoNinenininegenneunneufneeveTentititienzehndixdiez1、夾角余弦2、相關(guān)系數(shù)R型聚類統(tǒng)計量對兩個指標之間的相似程度用相似系數(shù)來刻劃,相似系數(shù)絕對對值越接近于1,表示指標間的關(guān)系越密切,絕對值越接近于0,表示指標間的關(guān)系越疏遠.當p

5、個指標是名義尺度時,例如p=6,有兩個樣品的指標的取值為:4系統(tǒng)聚類分析一系統(tǒng)聚類分析的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠的后聚成類,過程一直下去,每個樣品(或變量)總能聚到合適的類中。系統(tǒng)聚類分析過程是:假設(shè)總共有n個樣品(或變量),第一步將每個樣品(或變量)獨自聚成一類,共有n類;第二步根據(jù)所確定的樣品(或變量)“距離”公式,將距離較近的兩個樣品(或變量)聚合為一類,其他樣品(或變量)仍各自聚為一類,共有n-1類;第三步將“距離”最近的兩個類進一步聚成一類,共聚成n-2類;……以上步驟一直進行下去,最

6、后將所有的樣品或變量)聚成一類。將整個分類系統(tǒng)地畫成一張譜系圖,所以有時系統(tǒng)聚類分析也叫譜系聚類分析。二類間距離首先定義類與類之間地距離,又類間的距離定義不同產(chǎn)生不同的系統(tǒng)聚類分析。常見的類間的距離有法。它們的歸類步驟基本是一致的。8種之多,與之相應(yīng)的系統(tǒng)聚類分析也有8種之多、分別為最短距離法、最長距離法、中間距離法、重心法、類平均法、可變類平均法、可變法和離差平方和2.1最短距離法(nearestneighbor或singlelinkagemethod)定義類與類之間的距離為兩類最近樣品的距離,即設(shè)類合并成一新類記為,則任

7、一類的距離為*最短距離法進行聚類分析的步驟如下:(1)定義樣品之間的距離(2)找出距離最小元素,設(shè)為,則將合并成一新類記為,記為(3)按*式計算新類與其他類之間的距離。(4)重復(fù)(2),(3)的步驟,直到將所有元素并成一類為止。(如果某一步距離最小的元素不止一個,則將對應(yīng)這些最小元素的類可以同時合并)例1設(shè)有6個樣品,每個只測一個指標,分別是1,2,5,7,9,10,試采用絕對值距離用最短距離法將它們進行分類。解(1)樣品首先采用絕對值距離,計算樣品之間的距離陣為D(0).G1G2G3G4G5G6G10G210G3430G4

8、6520G587420G6985210D(0)G2={2}G1={1}G3={5}G4={7}G5={9}G6={10}G7G8G9G10123D2.2最長距離法(farthestneighbor或completelinkagemethod)定義類與類之間的距離為兩類最遠樣品的距離,即最長

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。