資源描述:
《spss聚類分析教程ppt課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、2021/7/291基本統(tǒng)計分析有了數(shù)據(jù),可以利用SPSS的各種分析方法進行分析,但選擇何種統(tǒng)計分析方法,即調(diào)用哪個統(tǒng)計分析過程,是得到正確分析結(jié)果的關(guān)鍵SPSS有數(shù)字分析和作圖分析兩類方法2021/7/292基本統(tǒng)計分析概述目錄上頁下頁返回結(jié)束基本統(tǒng)計分析是進行其他更深入的統(tǒng)計分析的前提,通過基本統(tǒng)計分析,用戶可以對分析數(shù)據(jù)的總體特征有比較準(zhǔn)確的把握,從而選擇更為深入的分析方法對分析對象進行研究。在SPSS的Analyze菜單中包括了一系列統(tǒng)計分析過程。其中Reports和DescriptiveStatisti
2、cs命令項中包括的功能是對單變量的描述統(tǒng)計分析DescriptiveStatistics包括的統(tǒng)計功能有:Frequencies:頻數(shù)分析Descriptives:描述統(tǒng)計量分析Explore:探索分析Crosstabs:多維頻數(shù)分布交叉表(列聯(lián)表)2021/7/294描述統(tǒng)計分析過程Descriptives目錄上頁下頁返回結(jié)束1、功能:了解數(shù)據(jù)的基本統(tǒng)計特征和對指定的變量值進行標(biāo)準(zhǔn)化處理(標(biāo)準(zhǔn)化后的新變量的均值為0,標(biāo)準(zhǔn)差為1,目的是為了消除各變量間變量值在數(shù)量級上的差異,從而增強數(shù)據(jù)間的可比性)。2、描述統(tǒng)計
3、分析過程通過平均值(Mean)、算術(shù)和(Sum)、標(biāo)準(zhǔn)差(StdDev)、最大值(Maximum)、最小值(Minimum)、方差(Variance)、范圍(Range)、平均數(shù)標(biāo)準(zhǔn)誤(S.E.Mean)等統(tǒng)計量對變量進行描述。2021/7/295目錄上頁下頁返回結(jié)束SPSS數(shù)值統(tǒng)計分析過程均在Analyze菜單中基本統(tǒng)計分析:Reports,DescriptiveStatisticsb、均值比較與檢驗:CompareMeansd、方差分析:ANOVAModelsb、相關(guān)分析:Correlatee、回歸分析:Re
4、gressionf、聚類與判別:Classifyg、因子分析:DataReductionh、非參數(shù)檢驗:NonparametricTests等等第一章聚類分析聚類分析的基本思想聚類分析上機實現(xiàn)2021/7/2962021/7/297§1.1聚類分析的思想目錄上頁下頁返回結(jié)束我們認(rèn)為,所研究的樣品或指標(biāo)(變量)之間是存在著程度不同的相似性(親疏關(guān)系)。于是根據(jù)一批樣品的多個觀測指標(biāo),具體找出一些能夠度量樣品或指標(biāo)之間的相似程度的統(tǒng)計量,以這些統(tǒng)計量為劃分類型的依據(jù),把一些相似程度較大的樣品(或指標(biāo))聚合為一類,把另
5、外一些彼此之間相似程度較大的樣品(或指標(biāo))又聚合為另外一類,…。關(guān)系密切的聚合到一個小的分類單位,關(guān)系疏遠(yuǎn)的聚合到一個大的分類單位,直到把所有的樣品(或指標(biāo))都聚合完畢,把不同的類型一一劃分出來,形成一個由小到大的分類系統(tǒng)。最后再把整個分類系統(tǒng)畫成一張分群圖(又稱譜系圖),用它把所有的樣品(或指標(biāo))間的親疏關(guān)系表示出來。2021/7/298目錄上頁下頁返回結(jié)束對樣品的分類常稱為Q型聚類分析對變量的分類常稱為R型聚類分析2021/7/299§1.1聚類分析的思想目錄上頁下頁返回結(jié)束聚類的目的在一些社會、經(jīng)濟問題中,
6、我們面臨的往往是比較復(fù)雜的研究對象,如果能把相似的樣品(或指標(biāo))歸成類,處理起來就大為方便,聚類分析的目的就是把相似的研究對象歸成類。【例1】若我們需要將下列11戶城鎮(zhèn)居民按戶主個人的收入進行分類,對每戶作了如下的統(tǒng)計,結(jié)果列于表3.1。在表中,“標(biāo)準(zhǔn)工資收入”、“職工獎金”、“職工津貼”、“性別”、“就業(yè)身份”等稱為指標(biāo),每戶稱為樣品。若對戶主進行分類,還可以采用其他指標(biāo),如“子女個數(shù)”、“政治面貌”等,指標(biāo)如何選擇取決于聚類的目的。2021/7/2910目錄上頁下頁返回結(jié)束2021/7/2911目錄上頁下頁返
7、回結(jié)束上例中的8個指標(biāo),前6個是定量的,后2個是定性的。如果分得更細(xì)一些,指標(biāo)的類型有三種尺度間隔尺度。變量用連續(xù)的量來表示。有序尺度。指標(biāo)用有序的等級來表示,有次序關(guān)系,但沒有數(shù)量表示。名義尺度。指標(biāo)用一些類來表示,這些類之間沒有等級關(guān)系也沒有數(shù)量關(guān)系。不同類型的指標(biāo),在聚類分析中,處理的方式是大不一樣的??偟膩碚f,提供給間隔尺度的指標(biāo)的方法較多,對另兩種尺度的變量處理的方法不多。2021/7/2912目錄上頁下頁返回結(jié)束第一位重要的問題是“什么是類”?粗糙地講,相似樣品(或指標(biāo))的集合稱作類。。聚類分析給人們
8、提供了豐富多采的方法進行分類,這些方法大致可歸納為:(1)系統(tǒng)聚類法。(2)模糊聚類法。(3)K-均值法。(4)有序樣品的聚類。(5)分解法。(6)加入法。2021/7/2913§1.2系統(tǒng)聚類法目錄上頁下頁返回結(jié)束(1)最短距離法。(nearestneighbor或singlelinkagemethod)2021/7/2914目錄上頁下頁返回結(jié)束(2)最長距離法(far