《數(shù)據(jù)特征的描述》PPT課件.ppt

《數(shù)據(jù)特征的描述》PPT課件.ppt

ID:52087531

大?。?88.84 KB

頁數(shù):14頁

時間:2020-03-31

《數(shù)據(jù)特征的描述》PPT課件.ppt_第1頁
《數(shù)據(jù)特征的描述》PPT課件.ppt_第2頁
《數(shù)據(jù)特征的描述》PPT課件.ppt_第3頁
《數(shù)據(jù)特征的描述》PPT課件.ppt_第4頁
《數(shù)據(jù)特征的描述》PPT課件.ppt_第5頁
資源描述:

《《數(shù)據(jù)特征的描述》PPT課件.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫

1、第三章數(shù)據(jù)特征的描述大量數(shù)據(jù)經(jīng)過整理后,已經(jīng)能夠初步反映數(shù)據(jù)(或總體)的分布規(guī)律,特別地頻率分布圖形給了我們一個直觀的印象。然而,在統(tǒng)計分析和決策中,還需要通過一些概括性的數(shù)值來對數(shù)據(jù)的分布特征進(jìn)行更為精確、簡練的描述。3.1數(shù)據(jù)集中趨勢特征的描述3.2數(shù)據(jù)離中趨勢特征的描述3.3數(shù)據(jù)分布形態(tài)特征的描述3.4統(tǒng)計表與統(tǒng)計圖7/21/20211寧波大學(xué)商學(xué)院鄭建華3.1數(shù)據(jù)集中趨勢特征的描述集中趨勢(centraltendency)是指一組數(shù)據(jù)向某一中心值靠攏的傾向。描述集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值。3.1.1算術(shù)平均數(shù)(arithmeticmean)3

2、.1.2眾數(shù)(mode)3.1.3中位數(shù)(median)3.1.4均值、眾數(shù)、中位數(shù)的比較7/21/20212寧波大學(xué)商學(xué)院鄭建華3.1.1算術(shù)平均數(shù)算術(shù)平均數(shù)有時簡稱為均值(mean),定義為全部數(shù)據(jù)的總和除以數(shù)據(jù)的個數(shù)。一般用記號:μ(總體數(shù)據(jù)的均值)和(樣本數(shù)據(jù)的均值)。根據(jù)數(shù)據(jù)的表現(xiàn)形式不同,有不同的計算公式。原始數(shù)據(jù):簡單算術(shù)平均分組數(shù)據(jù):加權(quán)算術(shù)平均7/21/20213寧波大學(xué)商學(xué)院鄭建華例題:數(shù)據(jù)特征描述案例.xls7/21/20214寧波大學(xué)商學(xué)院鄭建華均值的性質(zhì)特點:對一個數(shù)量數(shù)據(jù)(觀察值全體),只可能有一個均值存在;均值考慮了數(shù)據(jù)集中的每個觀察值;

3、均值易受極端觀察值的影響;每個觀察值與均值的離差值和為零(正負(fù)抵消);每個觀察值與均值的離差平方和為最小。7/21/20215寧波大學(xué)商學(xué)院鄭建華3.1.2眾數(shù)眾數(shù)(Mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多或最頻繁的觀察值。如:(a)5,7,10,8,9,9,6,100;(b)3,3,4,5,7,5;(c)2,4,8,7,9(d)某停車處停放汽車的顏色:3紅,12黑,6蘭??梢姡罕姅?shù)既可用于變量數(shù)據(jù)也可用于屬性數(shù)據(jù);眾數(shù)不受極端值的影響;一組數(shù)據(jù)不一定存在眾數(shù),也可能不止一個眾數(shù)。7/21/20216寧波大學(xué)商學(xué)院鄭建華對于組距分組,假設(shè)數(shù)據(jù)的分布具有明顯的集中趨勢,頻數(shù)直

4、方圖具有單峰形態(tài),同時假設(shè)眾數(shù)組的頻數(shù)在該組是分布均勻的,則眾數(shù)的估計方法如下:頻數(shù)分布圖法:modemedian.doc公式法:modemedian.doc計算舉例:數(shù)據(jù)特征描述案例.xls7/21/20217寧波大學(xué)商學(xué)院鄭建華3.1.3中位數(shù)中位數(shù)(median)是一組數(shù)據(jù)按大小順序排列后,處于全部數(shù)據(jù)中間位置的數(shù)值。數(shù)據(jù)包含n個觀察值,則中位數(shù)的位置由(n+1)/2確定。當(dāng)n為奇數(shù)時,該位置存在一個觀察數(shù)值,它就是中位數(shù)。當(dāng)n為偶數(shù)時,該位置處于n/2和n/2+1兩個整數(shù)位置的中間,因而不存在觀察值與其對應(yīng),定義中位數(shù)為處于n/2和n/2+1位置的兩數(shù)的算術(shù)平

5、均數(shù)。原始數(shù)據(jù)情形,組距分組數(shù)據(jù)情形。數(shù)據(jù)特征描述案例.xls7/21/20218寧波大學(xué)商學(xué)院鄭建華中位數(shù)存在如下特點:中位數(shù)受極端值的影響很?。恢形粩?shù)適合于任何類型的數(shù)據(jù),只要數(shù)據(jù)能夠以某種方式排序;在確定中位數(shù)時,并沒有考慮所有的觀察值;7/21/20219寧波大學(xué)商學(xué)院鄭建華3.1.4均值、眾數(shù)、中位數(shù)的比較均值、眾數(shù)、中位數(shù)的關(guān)系從頻率曲線圖看:眾數(shù)出現(xiàn)的頻率最高,始終對應(yīng)曲線的最高峰;中位數(shù)處于數(shù)據(jù)的中間位置,平分頻率分布曲線下方的面積;均值為所有數(shù)據(jù)的算術(shù)平均,對應(yīng)分布曲線的型心(或重心)。從數(shù)值大小看,Me處于三數(shù)中間;且存在近似關(guān)系:Mo-mean≈

6、3(Me-mean).平均數(shù)關(guān)系.doc7/21/202110寧波大學(xué)商學(xué)院鄭建華使用場合:如果數(shù)據(jù)分布具有明顯的單峰形態(tài),且峰值較為突出,想用一個數(shù)據(jù)代表“典型水平”,則眾數(shù)比較合適.如果想說明“一般水平”或“中間水平”,中位數(shù)和均值比較合適.如果數(shù)據(jù)包含極端值,我們希望用一個代表性數(shù)值反映數(shù)據(jù)的“一般水平”或“中間水平”,而且側(cè)重于后者,中位數(shù)更合適.均值只能適合于定量性數(shù)據(jù),中位數(shù)適合于有序數(shù)據(jù)和定量性數(shù)據(jù),眾數(shù)適合于定性和定量的數(shù)據(jù).7/21/202111寧波大學(xué)商學(xué)院鄭建華3.2數(shù)據(jù)離中趨勢特征的描述離中趨勢(tendencyofdeviationfromt

7、hecentralvalue)反映的是數(shù)據(jù)的觀察值之間的差異或遠(yuǎn)離中心值的程度,也稱離散(dispersionorspread)程度.集中趨勢和離中趨勢是數(shù)據(jù)分布的兩個不同側(cè)面的特征.極差(range):平均差(meandeviation)方差和標(biāo)準(zhǔn)差(varianceandstandarddeviation):離散系數(shù)(coefficientofvariation):數(shù)據(jù)標(biāo)準(zhǔn)化得分(score):7/21/202112寧波大學(xué)商學(xué)院鄭建華3.3數(shù)據(jù)分布形態(tài)的描述偏度系數(shù)(Skewness)峰度系數(shù)(Kurtosis)7/21/202113寧波大學(xué)商

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。