應用多元統(tǒng)計分析習題解答_聚類分析

應用多元統(tǒng)計分析習題解答_聚類分析

ID:37149609

大小:1.10 MB

頁數(shù):25頁

時間:2019-05-19

應用多元統(tǒng)計分析習題解答_聚類分析_第1頁
應用多元統(tǒng)計分析習題解答_聚類分析_第2頁
應用多元統(tǒng)計分析習題解答_聚類分析_第3頁
應用多元統(tǒng)計分析習題解答_聚類分析_第4頁
應用多元統(tǒng)計分析習題解答_聚類分析_第5頁
資源描述:

《應用多元統(tǒng)計分析習題解答_聚類分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、--WORD格式--可編輯--專業(yè)資料-----第五章聚類分析5.1判別分析和聚類分析有何區(qū)別?答:即根據(jù)一定的判別準則,判定一個樣本歸屬于哪一類。具體而言,設有n個樣本,對每個樣本測得p項指標(變量)的數(shù)據(jù),已知每個樣本屬于k個類別(或總體)中的某一類,通過找出一個最優(yōu)的劃分,使得不同類別的樣本盡可能地區(qū)別開,并判別該樣本屬于哪個總體。聚類分析是分析如何對樣品(或變量)進行量化分類的問題。在聚類之前,我們并不知道總體,而是通過一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來講,判別分析是在已知有多少類及是什么類的情況下進行分類,而聚類分析是在不知道類的情況下進行分類。5.2試述系統(tǒng)

2、聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠的后聚成類,過程一直進行下去,每個樣品(或變量)總能聚到合適的類中。5.3對樣品和變量進行聚類分析時,所構(gòu)造的統(tǒng)計量分別是什么?簡要說明為什么這樣構(gòu)造?答:對樣品進行聚類分析時,用距離來測定樣品之間的相似程度。因為我們把n個樣本看作p維空間的n個點。點之間的距離即可代表樣品間的相似度。常用的距離為(一)閔可夫斯基距離:q取不同值,分為(1)絕對距離()(2)歐氏距離()(3)切比雪夫距離()--學習資料分享------WORD格式--可編輯--專業(yè)資料-----(二)馬氏距離(三)蘭氏距離對變量的相似性,我們

3、更多地要了解變量的變化趨勢或變化方向,因此用相關(guān)性進行衡量。將變量看作p維空間的向量,一般用(一)夾角余弦(二)相關(guān)系數(shù)5.4在進行系統(tǒng)聚類時,不同類間距離計算方法有何區(qū)別?選擇距離公式應遵循哪些原則?答:設dij表示樣品Xi與Xj之間距離,用Dij表示類Gi與Gj之間的距離。(1).最短距離法--學習資料分享------WORD格式--可編輯--專業(yè)資料-----(2)最長距離法(3)中間距離法其中(4)重心法(5)類平均法(6)可變類平均法其中b是可變的且b<1(7)可變法其中b是可變的且b<1(8)離差平方和法--學習資料分享------WORD格式--可編輯--專業(yè)資料-----通常

4、選擇距離公式應注意遵循以下的基本原則:(1)要考慮所選擇的距離公式在實際應用中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2)要綜合考慮對樣本觀測數(shù)據(jù)的預處理和將要采用的聚類分析方法。如在進行聚類分析之前已經(jīng)對變量作了標準化處理,則通常就可采用歐氏距離。(3)要考慮研究對象的特點和計算量的大小。樣品間距離公式的選擇是一個比較復雜且?guī)в幸欢ㄖ饔^性的問題,我們應根據(jù)研究對象的特點不同做出具體分折。實際中,聚類分析前不妨試探性地多選擇幾個距離公式分別進行聚類,然后對聚類分析的結(jié)果進行對比分析,以確定最合適的距離測度方法。5.5試述K均值法與系統(tǒng)聚類法的異同。

5、答:相同:K—均值法和系統(tǒng)聚類法一樣,都是以距離的遠近親疏為標準進行聚類的。不同:系統(tǒng)聚類對不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K—均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開實踐經(jīng)驗的積累;有時也可以借助系統(tǒng)聚類法以一部分樣品為對象進行聚類,其結(jié)果作為K—均值法確定類數(shù)的參考。5.6試述K均值法與系統(tǒng)聚類有何區(qū)別?試述有序聚類法的基本思想。--學習資料分享------WORD格式--可編輯--專業(yè)資料-----答:K均值法的基本思想是將每一個樣品分配給最近中心(均值)的類中。系統(tǒng)聚類對不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K—均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,有時也可

6、以借助系統(tǒng)聚類法以一部分樣品為對象進行聚類,其結(jié)果作為K均值法確定類數(shù)的參考。有序聚類就是解決樣品的次序不能變動時的聚類分析問題。如果用表示個有序的樣品,則每一類必須是這樣的形式,即,其中且,簡記為。在同一類中的樣品是次序相鄰的。一般的步驟是(1)計算直徑{D(i,j)}。(2)計算最小分類損失函數(shù){L[p(l,k)]}。(3)確定分類個數(shù)k。(4)最優(yōu)分類。5.7檢測某類產(chǎn)品的重量,抽了六個樣品,每個樣品只測了一個指標,分別為1,2,3,6,9,11.試用最短距離法,重心法進行聚類分析。(1)用最短距離法進行聚類分析。采用絕對值距離,計算樣品間距離陣01021054308763010985

7、20由上表易知中最小元素是于是將,,聚為一類,記為計算距離陣--學習資料分享------WORD格式--可編輯--專業(yè)資料-----0306308520中最小元素是=2于是將,聚為一類,記為計算樣本距離陣030630中最小元素是于是將,聚為一類,記為因此,(2)用重心法進行聚類分析計算樣品間平方距離陣0104102516906449369010081642540易知中最小元素是于是將,,聚為一類,記為--學習

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。