關(guān)于r軟件在系統(tǒng)聚類分析中的應(yīng)用

關(guān)于r軟件在系統(tǒng)聚類分析中的應(yīng)用

ID:9688045

大?。?8.50 KB

頁數(shù):2頁

時(shí)間:2018-05-05

關(guān)于r軟件在系統(tǒng)聚類分析中的應(yīng)用_第1頁
關(guān)于r軟件在系統(tǒng)聚類分析中的應(yīng)用_第2頁
資源描述:

《關(guān)于r軟件在系統(tǒng)聚類分析中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫

1、關(guān)于R軟件在系統(tǒng)聚類分析中的應(yīng)用歡迎來到站,今天本網(wǎng)站為大家提供了R軟件在系統(tǒng)聚類分析中的應(yīng)用,希望朋友們讀后有所收獲!引言多元統(tǒng)計(jì)分析是統(tǒng)計(jì)學(xué)的一個(gè)重要分支,也稱多變量統(tǒng)計(jì)分析;在現(xiàn)實(shí)生活中,受多種指標(biāo)共同作用和影響的現(xiàn)象大量存在,多元統(tǒng)計(jì)分析就是研究多個(gè)隨機(jī)變量之間相互依賴關(guān)系及其內(nèi)在統(tǒng)計(jì)規(guī)律的重要學(xué)科,其中最常用聚類分析方法,由于多元統(tǒng)計(jì)聚類分析方法一般涉及復(fù)雜的數(shù)學(xué)理論,一般無法用手工計(jì)算,必須有計(jì)算機(jī)和統(tǒng)計(jì)軟件的支持。在統(tǒng)計(jì)軟件方面,常用的統(tǒng)計(jì)軟件有SPSS、SAS、STAT、R、S-P

2、LUS,等等。R軟件是一個(gè)自由、免費(fèi)、開源的軟件,是一個(gè)具有強(qiáng)大統(tǒng)計(jì)分析功能和優(yōu)秀統(tǒng)計(jì)制圖功能的統(tǒng)計(jì)軟件,現(xiàn)已是國(guó)內(nèi)外眾多統(tǒng)計(jì)學(xué)者喜愛的數(shù)據(jù)分析工具。本文結(jié)合實(shí)例介紹R軟件在多元統(tǒng)計(jì)聚類分析中的應(yīng)用。一、系統(tǒng)聚類分析聚類分析又稱群分析,它是研究(樣品或指標(biāo))分類問題的一種多元統(tǒng)計(jì)方法,所謂類,通俗地說,就是指相似元素的集合。在社會(huì)經(jīng)濟(jì)領(lǐng)域中存在著大量分類問題,比如若對(duì)某些大城市的物價(jià)指數(shù)進(jìn)行考察,而物價(jià)指數(shù)很多,有農(nóng)用生產(chǎn)物價(jià)指數(shù)、服務(wù)項(xiàng)目?jī)r(jià)指數(shù)、食品消費(fèi)物價(jià)指數(shù)、建材零售價(jià)格指數(shù)等等。由于要考察

3、的物價(jià)指數(shù)很多,通常先對(duì)這些物價(jià)指數(shù)進(jìn)行分類。總之,需要分類的問題很多,因此聚類分析這個(gè)有用的工具越來越受到人們的重視,它在許多領(lǐng)域中都得到了廣泛的應(yīng)用。聚類分析內(nèi)容非常豐富,有系統(tǒng)聚類法、有序樣品聚類法、動(dòng)態(tài)聚類法、模糊聚類法、圖論聚類法、聚類預(yù)報(bào)法等;最常用最成功的聚類分析為系統(tǒng)聚類法,系統(tǒng)聚類法的基本思想為先將n個(gè)樣品各自看成一類,然后規(guī)定樣品之間的距離和類與類之間的距離。選擇距離最近的兩類合并成一個(gè)新類,計(jì)算新類和其他類(各當(dāng)前類)的距離,再將距離最近的兩類合并。這樣,每次合并減少一類,直

4、至所有的樣品都?xì)w成一類為止。系統(tǒng)聚類法的基本步驟:1、計(jì)算n個(gè)樣品兩兩間的距離。2、構(gòu)造n個(gè)類,每個(gè)類只包含一個(gè)樣品。3、合并距離最近的兩類為一新類。4、計(jì)算新類與各當(dāng)前類的距離。5、重復(fù)步驟3、4,合并距離最近的兩類為新類,直到所有的類并為一類為止。6、畫聚類譜系圖。7、決定類的個(gè)數(shù)和類。系統(tǒng)聚類方法:1、最短距離法;2、最長(zhǎng)距離法;3、中間距離法;4、重心法;5、類平均法;6、離差平方和法(ethod=plete,members=NULL)其中,d是由dist構(gòu)成的距離結(jié)構(gòu),具體包括絕對(duì)值距離

5、、歐氏距離、切比雪夫距離、馬氏距離、蘭氏距離等,默認(rèn)為歐氏距離;method包括類平均法average、重心法centroid、中間距離法median、最長(zhǎng)距離法plete、最短距離法single、離差平方和法(clipboard,header=T)>roes(X)<-c(濟(jì)南,青島,淄博,棗莊,東營(yíng),煙臺(tái),濰坊,濟(jì)寧,泰安,威海,日照,萊蕪,臨沂,德州,聊城,濱州,菏澤)>d<-dist(scale(X)) >hc1<-hclust(d,single)#最短距

6、離法>hc2<-hclust(d,plete)#最長(zhǎng)距離法>hc3<-hclust(d,median)#中間距離法>hc4<-hclust(d,froargin-top:0pt;margin-bottom:0pt">小編為您準(zhǔn)備的R軟件在系統(tǒng)聚類分析中的應(yīng)用,希望可以幫到您!

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。