資源描述:
《《統(tǒng)計資料的整理》PPT課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、為什么進行統(tǒng)計資料的整理?分類表中序列表與頻數(shù)估計表各適合于何種情況?雙變量二元分布表中數(shù)據(jù)的含義如何?統(tǒng)計資料整理的目的調(diào)查收集到的原始統(tǒng)計資料常常是大量的。它必須經(jīng)過加工整理,如分類歸并匯總,按時間前后或按數(shù)值大小重新排列等,才容易發(fā)現(xiàn)數(shù)據(jù)的規(guī)律性,并便于做進一步的統(tǒng)計分析。加工整理,歸并匯總,重新排列調(diào)查得到的原始統(tǒng)計資料發(fā)現(xiàn)數(shù)據(jù)的規(guī)律性,作進一步的統(tǒng)計分析統(tǒng)計表類型將變量所取值按時間順序排列序列表分類表按數(shù)值分類定性分布頻數(shù)分布時間序列表地域序列將變量所取值按地域排列按性質(zhì)分類2.1統(tǒng)計表時間序列表的例子:2.1統(tǒng)計表定性分布:首先建立一個元
2、素的類別系統(tǒng),使得各類互相排斥,而且是完備的,使被觀測的各元素能既不重復又無遺漏地分到各類中去。然后記錄分到同類中的元素個數(shù),或?qū)⑼愔懈髟氐挠^測值加以歸并,這樣得到定性分布。元素分類觀測值記錄與歸并定性分布2.1統(tǒng)計表定性分布的例子:2.1統(tǒng)計表頻數(shù)分布:按變量所取的值進行分類,于是資料中每個觀測值都分到相應類中去。記錄各類中觀測值出現(xiàn)的次數(shù),制成頻數(shù)分布表。確定組數(shù)k找出xmin與xmax計算組距h確定每組上下限將相應數(shù)據(jù)歸并到各組Xmin最小值,xmax最大值2.1統(tǒng)計表分數(shù)計數(shù)人數(shù)(f)40—49150—59正正1460—69正正正正正正正
3、正正正正5570—79正正正正正正正正正正正5880—89正正正正正正正正正正5290—99正正正17100—1093總數(shù)200在所屬組的記錄欄做一記號,按照我國習慣,用寫“正”字方法,英文書使用“#”符號表2-4某校200個學生高等數(shù)學考試成績2.1統(tǒng)計表表2-5某校200個學生高等數(shù)學考試成績的頻數(shù)分布表分數(shù)人數(shù)(f)分數(shù)人數(shù)(f)40—45176—812546—51082—874252—571288—931058—632994—991164—6928100—105370—7539總數(shù)2002.1統(tǒng)計表2.1統(tǒng)計表表2-5與表2-6的對比表2-5
4、中組距等于6,頻數(shù)分布的規(guī)則性,仍然可以維持,同時細節(jié)的損失也可減輕表2-6中的組距等于2,各組頻數(shù)分布就變得很不規(guī)則了。由此可見,組數(shù)的確定應適當,亦不宜太多2.1統(tǒng)計表累積頻數(shù)(CumulativeFrequency):由第一組起至第i組止各頻數(shù)之和稱為第i組的累積頻數(shù),記為Fi,即:頻率(PercentFrequency):就是頻數(shù)除以總數(shù)n:fi/n,經(jīng)常以百分數(shù)表示。累計頻數(shù)與頻率2.1統(tǒng)計表頻數(shù)表的例子2.1統(tǒng)計表統(tǒng)計圖:統(tǒng)計資料整理成統(tǒng)計表后,可以比較清晰地展示變量的變化規(guī)律。為了使這種規(guī)律更有直觀性,常采用統(tǒng)計圖表示。包括:線圖、條形
5、圖、圓餅圖等2.2統(tǒng)計圖2.2統(tǒng)計圖線圖(Linegraph)2.2統(tǒng)計圖(億元)條形圖(Barchart)2.2統(tǒng)計圖(億元)圓餅圖(Piechart)2.2統(tǒng)計圖散點圖(ScatterDiagram)2.2統(tǒng)計圖雙變量的統(tǒng)計資料:對每一元素觀測兩個特征,記錄觀測結(jié)果,就是雙變量的統(tǒng)計資料雙變量常用(X,Y)形式表示,以區(qū)別兩個單變量X和Y2.3雙變量的二元分布錯誤發(fā)生時的飛行狀態(tài),分起飛(T),巡航(C)和著陸(L)三種。錯誤發(fā)生的原因,分規(guī)范理解錯誤(R),儀表讀數(shù)錯誤(M)和其它原因(O)三種。[例2.1]在飛行模擬訓練時,用計算機測定并打印
6、出飛行動作的錯誤,從兩方面進行測定:2.3雙變量的二元分布測定45次的打印記錄如下:2.3雙變量的二元分布根據(jù)該記錄整理的二元分布表如下:從表中看出,在起飛(T)時容易發(fā)生規(guī)范理解錯誤(R)和儀表讀數(shù)錯誤(M),而著陸(L)時不太容易發(fā)生規(guī)范理解錯誤。2.3雙變量的二元分布邊際分布:在二元分布表最下行(合計行)和最右列(合計列)分別是X和Y的單變量分布,稱為邊際分布。二元分布表最下行二元分布表最右行X的單變量分布Y的單變量分布邊際分布統(tǒng)稱2.3雙變量的二元分布一個雙變量的二元分布絕不同于兩個單變量的一元分布,它不僅說明兩變量各自的分布情況,而且說明兩
7、變量之間(飛行狀態(tài)與錯誤原因之間)的相互關(guān)聯(lián)情況。而這種關(guān)聯(lián)情況(即是否存在關(guān)聯(lián)以及關(guān)聯(lián)的性態(tài)和程度等)正是研究雙變量的二元分布的主要任務。雙變量二元分布兩變量各自的分布情況變量之間相互關(guān)聯(lián)情況研究二元分布的主要任務說明2.3雙變量的二元分布對于三變量(X,Y,Z)的統(tǒng)計資料,整理成分布表的形式是困難的,常用的方法是對于X的每一特定值xi,研究(Y,Z)的二元分布。更多變量的情形也類似。2.3雙變量的二元分布