資源描述:
《spss描述性統(tǒng)計基礎(chǔ).ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第二部分統(tǒng)計描述與統(tǒng)計圖表主要內(nèi)容1、連續(xù)變量的統(tǒng)計描述與參數(shù)估計2、分類變量的統(tǒng)計描述與參數(shù)估計3、數(shù)據(jù)的圖形展示2.1連續(xù)變量的統(tǒng)計描述與參數(shù)估計描述性統(tǒng)計分析是指用少量數(shù)字(即描述指標)概括大量原始數(shù)字,對數(shù)據(jù)進行描述的統(tǒng)計方法。主要包括以下幾個趨勢:1、集中趨勢:用于描述集中趨勢的統(tǒng)計量稱為位置統(tǒng)計量(LocationStatistic),如均值、中位數(shù)等;2、離散趨勢:用于描述數(shù)據(jù)波動范圍的大小又稱為尺度統(tǒng)計量(ScaleStatistic),如標準差、方差、四分位數(shù)間距等;3、分布特征:在分布假設(shè)下,描述數(shù)據(jù)偏離分布的嚴重程度,如偏度系數(shù)
2、和峰度系數(shù)等;4、其他趨勢:如百分位數(shù)指標、M統(tǒng)計量、極端值等。本節(jié)主要講述連續(xù)變量(Scale型)的統(tǒng)計描述。2.1連續(xù)變量的統(tǒng)計描述與參數(shù)估計SPSS用于連續(xù)變量統(tǒng)計描述的過程均擊中在DescriptiveStatitics子菜單中,包括:1、Frequencies過程:產(chǎn)生原始數(shù)據(jù)的頻數(shù)表,并能計算各種百分位數(shù),以及為數(shù)據(jù)直接繪制相應(yīng)的統(tǒng)計圖;2、Descriptives過程:用于進行一般的描述統(tǒng)計,特別適用于服從正態(tài)分布的連續(xù)型變量的統(tǒng)計描述;3、Explore過程:用于對連續(xù)型數(shù)據(jù)的分布狀況不清楚時的探索性分析;4、Ratio過程:用于對兩個連
3、續(xù)型變量計算相對比指標。2.1.1描述指標簡介集中趨勢的描述指標1、算數(shù)平均值(ArithmeticMean)對于一組數(shù)據(jù)而言,算數(shù)均值為:對應(yīng)的離差和為:2.1.1描述指標簡介集中趨勢的描述指標2、中位數(shù)(Median)將數(shù)據(jù)按大小順序排列,處于中間未知的量。中位數(shù)是位置平均數(shù),不收極端值的影響,在具有個別極大或極小標志值的分布數(shù)列中,分位數(shù)比算數(shù)均值更具有代表性。2.1.1描述指標簡介集中趨勢的描述指標3、其它指標截尾均值:由于均值較易受極端值的影響,則按照一定比例去掉兩端的數(shù)據(jù),只使用中部的數(shù)據(jù)來求的均值。如5%截尾均值。幾何均值:眾數(shù)(Mode)
4、:樣本中出現(xiàn)頻數(shù)最大的數(shù)。調(diào)和均值(H):數(shù)據(jù)倒數(shù)均值的倒數(shù)。2.1.1描述指標簡介離散趨勢的描述指標1、全距(Range):全距又稱極差,是數(shù)據(jù)中最大值和最小值之差。2、方差(Variance)和標準差(StandardDeviation)2.1.1描述指標簡介離散趨勢的描述指標3、百分位數(shù)(Percentile)如果將一組數(shù)據(jù)從小到大排序,并計算相應(yīng)的累計百分位,則某一百分位所對應(yīng)數(shù)據(jù)的值就稱為這一百分位的百分位數(shù)。可表示為:一組n個觀測值按數(shù)值大小排列如,處于p%位置的值稱第p百分位數(shù)。4、四分位數(shù)(Quartile)及四分位數(shù)間距(Q1,Q2,Q
5、3)可用于排除部分極端值對變異指標的影響,適用于任意分布的數(shù)據(jù)。2.1.1描述指標簡介離散趨勢的描述指標5、變異系數(shù)(CoefficientofVariation)在許多情況下無法使用樣本方差來比較兩組數(shù)據(jù)間離散程度的大小,則可使用變異系數(shù)來比較。2.1.1描述指標簡介其它描述指標1、峰度系數(shù)(Kurtosis)峰度系數(shù)是用來反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標。峰度系數(shù)為0,說明其峰度與正態(tài)分布相同;大于0,說明其比正態(tài)分布要陡峭;小于0,說明其比正態(tài)分布要平緩。2.1.1描述指標簡介其它描述指標2、偏度系數(shù)(Skewness)偏度系數(shù)用以測度數(shù)據(jù)
6、分布與正態(tài)分布相比的不對稱性情況,刻畫以平均值為中心的偏向情況,其小于0,表示負偏,即均值在峰值的左邊;其大于0,表示正偏,即均值在峰值的右邊;其等于0,表示對稱分布。2.1.2連續(xù)型變量統(tǒng)計描述實例以student.sav數(shù)據(jù)文件為例,對男性和女性身高數(shù)據(jù)進行統(tǒng)計描述,并對分析結(jié)果進行解讀。1、使用Explore過程進行分析;2、使用Descriptive過程進行分析;3、使用Frequencies過程進行分析。2.1.3連續(xù)型變量的參數(shù)估計根據(jù)樣本數(shù)據(jù)對總體的客觀規(guī)律性作出合理估計的過程稱為統(tǒng)計推斷(StatisticalInference),其分為
7、參數(shù)估計和假設(shè)檢驗兩大類。其中參數(shù)估計是指用樣本信息來推斷總體特征中的未知參數(shù)。正態(tài)分布及標準正態(tài)分布是統(tǒng)計分析中的重要分布,SPSS中的Descriptive過程可以將原變量標準化。Explore過程也可進行變量的標準化,還可輸出參數(shù)估計結(jié)果。2.1.3連續(xù)型變量的參數(shù)估計正態(tài)分布的專用統(tǒng)計量:1、偏度(Skewness):用來描述變量取值分布形態(tài)的統(tǒng)計量,指分布不對稱的方向和程度,記為α。2、峰度(Kurtosis):用來描述變量取值分布形態(tài)陡緩程度的統(tǒng)計量,是指分布圖行的尖峭程度或峰凸程度,記為β。2.1.3連續(xù)型變量的參數(shù)估計點估計的基本方法:1
8、、矩估計法2、極大似然估計法3、穩(wěn)健估計法(M-Estimator)矩估計法和極