資源描述:
《spss聚類分析教程ppt課件.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、2021/7/291基本統(tǒng)計(jì)分析有了數(shù)據(jù),可以利用SPSS的各種分析方法進(jìn)行分析,但選擇何種統(tǒng)計(jì)分析方法,即調(diào)用哪個(gè)統(tǒng)計(jì)分析過程,是得到正確分析結(jié)果的關(guān)鍵SPSS有數(shù)字分析和作圖分析兩類方法2021/7/292基本統(tǒng)計(jì)分析概述目錄上頁下頁返回結(jié)束基本統(tǒng)計(jì)分析是進(jìn)行其他更深入的統(tǒng)計(jì)分析的前提,通過基本統(tǒng)計(jì)分析,用戶可以對(duì)分析數(shù)據(jù)的總體特征有比較準(zhǔn)確的把握,從而選擇更為深入的分析方法對(duì)分析對(duì)象進(jìn)行研究。在SPSS的Analyze菜單中包括了一系列統(tǒng)計(jì)分析過程。其中Reports和DescriptiveStatisti
2、cs命令項(xiàng)中包括的功能是對(duì)單變量的描述統(tǒng)計(jì)分析DescriptiveStatistics包括的統(tǒng)計(jì)功能有:Frequencies:頻數(shù)分析Descriptives:描述統(tǒng)計(jì)量分析Explore:探索分析Crosstabs:多維頻數(shù)分布交叉表(列聯(lián)表)2021/7/294描述統(tǒng)計(jì)分析過程Descriptives目錄上頁下頁返回結(jié)束1、功能:了解數(shù)據(jù)的基本統(tǒng)計(jì)特征和對(duì)指定的變量值進(jìn)行標(biāo)準(zhǔn)化處理(標(biāo)準(zhǔn)化后的新變量的均值為0,標(biāo)準(zhǔn)差為1,目的是為了消除各變量間變量值在數(shù)量級(jí)上的差異,從而增強(qiáng)數(shù)據(jù)間的可比性)。2、描述統(tǒng)計(jì)
3、分析過程通過平均值(Mean)、算術(shù)和(Sum)、標(biāo)準(zhǔn)差(StdDev)、最大值(Maximum)、最小值(Minimum)、方差(Variance)、范圍(Range)、平均數(shù)標(biāo)準(zhǔn)誤(S.E.Mean)等統(tǒng)計(jì)量對(duì)變量進(jìn)行描述。2021/7/295目錄上頁下頁返回結(jié)束SPSS數(shù)值統(tǒng)計(jì)分析過程均在Analyze菜單中基本統(tǒng)計(jì)分析:Reports,DescriptiveStatisticsb、均值比較與檢驗(yàn):CompareMeansd、方差分析:ANOVAModelsb、相關(guān)分析:Correlatee、回歸分析:Re
4、gressionf、聚類與判別:Classifyg、因子分析:DataReductionh、非參數(shù)檢驗(yàn):NonparametricTests等等第一章聚類分析聚類分析的基本思想聚類分析上機(jī)實(shí)現(xiàn)2021/7/2962021/7/297§1.1聚類分析的思想目錄上頁下頁返回結(jié)束我們認(rèn)為,所研究的樣品或指標(biāo)(變量)之間是存在著程度不同的相似性(親疏關(guān)系)。于是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體找出一些能夠度量樣品或指標(biāo)之間的相似程度的統(tǒng)計(jì)量,以這些統(tǒng)計(jì)量為劃分類型的依據(jù),把一些相似程度較大的樣品(或指標(biāo))聚合為一類,把另
5、外一些彼此之間相似程度較大的樣品(或指標(biāo))又聚合為另外一類,…。關(guān)系密切的聚合到一個(gè)小的分類單位,關(guān)系疏遠(yuǎn)的聚合到一個(gè)大的分類單位,直到把所有的樣品(或指標(biāo))都聚合完畢,把不同的類型一一劃分出來,形成一個(gè)由小到大的分類系統(tǒng)。最后再把整個(gè)分類系統(tǒng)畫成一張分群圖(又稱譜系圖),用它把所有的樣品(或指標(biāo))間的親疏關(guān)系表示出來。2021/7/298目錄上頁下頁返回結(jié)束對(duì)樣品的分類常稱為Q型聚類分析對(duì)變量的分類常稱為R型聚類分析2021/7/299§1.1聚類分析的思想目錄上頁下頁返回結(jié)束聚類的目的在一些社會(huì)、經(jīng)濟(jì)問題中,
6、我們面臨的往往是比較復(fù)雜的研究對(duì)象,如果能把相似的樣品(或指標(biāo))歸成類,處理起來就大為方便,聚類分析的目的就是把相似的研究對(duì)象歸成類?!纠?】若我們需要將下列11戶城鎮(zhèn)居民按戶主個(gè)人的收入進(jìn)行分類,對(duì)每戶作了如下的統(tǒng)計(jì),結(jié)果列于表3.1。在表中,“標(biāo)準(zhǔn)工資收入”、“職工獎(jiǎng)金”、“職工津貼”、“性別”、“就業(yè)身份”等稱為指標(biāo),每戶稱為樣品。若對(duì)戶主進(jìn)行分類,還可以采用其他指標(biāo),如“子女個(gè)數(shù)”、“政治面貌”等,指標(biāo)如何選擇取決于聚類的目的。2021/7/2910目錄上頁下頁返回結(jié)束2021/7/2911目錄上頁下頁返
7、回結(jié)束上例中的8個(gè)指標(biāo),前6個(gè)是定量的,后2個(gè)是定性的。如果分得更細(xì)一些,指標(biāo)的類型有三種尺度間隔尺度。變量用連續(xù)的量來表示。有序尺度。指標(biāo)用有序的等級(jí)來表示,有次序關(guān)系,但沒有數(shù)量表示。名義尺度。指標(biāo)用一些類來表示,這些類之間沒有等級(jí)關(guān)系也沒有數(shù)量關(guān)系。不同類型的指標(biāo),在聚類分析中,處理的方式是大不一樣的??偟膩碚f,提供給間隔尺度的指標(biāo)的方法較多,對(duì)另兩種尺度的變量處理的方法不多。2021/7/2912目錄上頁下頁返回結(jié)束第一位重要的問題是“什么是類”?粗糙地講,相似樣品(或指標(biāo))的集合稱作類。。聚類分析給人們
8、提供了豐富多采的方法進(jìn)行分類,這些方法大致可歸納為:(1)系統(tǒng)聚類法。(2)模糊聚類法。(3)K-均值法。(4)有序樣品的聚類。(5)分解法。(6)加入法。2021/7/2913§1.2系統(tǒng)聚類法目錄上頁下頁返回結(jié)束(1)最短距離法。(nearestneighbor或singlelinkagemethod)2021/7/2914目錄上頁下頁返回結(jié)束(2)最長(zhǎng)距離法(far