資源描述:
《檢驗和方差分析的原理和基本方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、汽車基地http://www.qcbase.com主機廠與供應(yīng)商的信息、服務(wù)、交流中心!《管理統(tǒng)計學》導學資料六——檢驗和方差分析這一講的內(nèi)容包括兩個部分開平方檢驗和方差分析,重點是方差分析,在本章的學習中,同學們要了解方差分析的用途,檢驗的作用和用途。學會和掌握方差分析表的使用,了解自由度的計算和F檢驗的作用,記住方差分析表中的五個等式和含義。本章的關(guān)鍵術(shù)語:方差分析(AnalysisofVariance,常簡稱為ANOVA)是用來檢驗兩個以上樣本的均值差異的顯著程度,由此判斷樣本究竟是否抽自具有同一均值總體的方法?! ST-總離差方和(
2、SumofSquareinTotal)為各樣本觀察值與總均值的離差平方和。 SSTR-組間離差方和(SumofSquareTreatment)表示不同的樣本組之間,由于因素取不同的水平所產(chǎn)生的離差平方和?! SE-組內(nèi)離差方和(SumofSquareError)表示同一樣本組內(nèi),由于隨機因素影響所產(chǎn)生的離差平方和,簡稱為組內(nèi)離差平方和。本章學完后,你應(yīng)當能夠:1、掌握用檢驗來解決獨立性檢驗和擬合性檢驗的原理和基本方法,能解決最常見的這類檢驗問題?! ?、了解和懂得單因素方差分析的原理和基本方法,能應(yīng)用計算機解決最常見的方差分析問題。一、檢
3、驗檢驗的用途是檢驗兩個變量之間的獨立性和檢驗數(shù)據(jù)是否服從某個概率分布得擬合檢驗。我們經(jīng)常會遇到受兩個或兩個以上因素(變量)影響的實驗或觀察數(shù)據(jù),并要求判斷兩個變量之間是否存在相互聯(lián)系的問題。如果兩個變量之間沒有聯(lián)系則稱作是獨立的,否則就是不獨立的。用分布可以檢驗兩個變量之間的獨立性問題。此時我們首先將研究對象的觀察數(shù)據(jù)按兩個變量分別進行分類。。例如,按行對第一個變量進行分類,按列對第二個變量進行分類。按這種方法把所有的試驗觀察數(shù)據(jù)排列成的表稱為列聯(lián)表。獨立性檢驗的程序和前面介紹的參數(shù)假設(shè)檢驗一樣,首先也要建立假設(shè),然后計算檢驗統(tǒng)計量的值。這次
4、采用的檢驗統(tǒng)計這次采用的檢驗統(tǒng)計量就是,再根據(jù)問題規(guī)定的顯著性水平查分布表,得到當原假設(shè)成立時檢驗統(tǒng)計量允許的最大臨界值,與計算所得的值作比較,得出接受或拒絕原假設(shè)的結(jié)論。具體步驟如下:1.提出假設(shè):兩個變量是獨立的,即相互之間沒有影響,海量管理資料下載,請登錄:汽車基地http://www.qcbase.com汽車基地http://www.qcbase.com主機廠與供應(yīng)商的信息、服務(wù)、交流中心!:兩個變量是不獨立的,即相互之間有影響。檢驗的結(jié)果如果接受原假設(shè)就說明不能推翻兩個變量是獨立的假設(shè);反之,拒絕,接受2將觀測數(shù)據(jù)分類,計算檢
5、驗統(tǒng)計量:我們要將需要檢驗的變量分類,只作如下的表格:變量B的分類變量A的類別12…..m行總和1O11O12…..O1mO1.2O21O22…..O2mO2.…..…..…..…..…..kOk1Ok2…..OkmOk.列總和O.1O.2O.mn這里,Oij表示具有第ij屬性的觀測的數(shù)量,i=1,2,..k,j=1,2,…m,Oi.表示第i行的觀測書的總值,O.j表示第j列的觀測數(shù)的總數(shù)。注意,這里Oij是實際觀測到的數(shù)據(jù)分類得到的。我們在后面還要計算在原假設(shè)成立的是觀測的理論數(shù)值。這里n是觀測的總數(shù)。定義=,這里是上邊分類得到的實際觀測數(shù)
6、,是與之相應(yīng)的位置上的期望值。是根據(jù)概率計算的,在原假設(shè)下兩個變量獨立,因而有:如果兩事件獨立,則它們的聯(lián)合概率就等于它們分別概率的乘積,即落入第ij格的概率等于落入第i行的概率與落入第j列的概率的乘積。由此可得到當總的觀察值的和為n時,與觀察值相對應(yīng)的期望值可按下式計算得到。=()()=利用上面的公式可以計算出相應(yīng)的個各個位置上的期望值。如果計算所得到的期望值過小,則最后得到的檢驗統(tǒng)計量就會估計過大,導致原假設(shè)被拒絕的概率過高。因此,實際檢驗中一般要求所有計算得到的期望值都不小于5。如果某些位置上的期望值小于5就可以把相鄰的類別合并,使
7、得結(jié)果計算得到的期望值都不小于5。3計算檢驗我們在上邊計算的值,就是反映兩個變量獨立性程度的變量。如果=0,那么這兩個變量獨立,當不等于0,越大兩個變量獨立的可能性越小,當達到一定的程度時我們就可以拒絕兩個變量獨立的假設(shè)。為了確定這個臨界值,我們就需要使用分布。首先我們需要確定的自由度,由于在計算期望值的時候,每行總數(shù)和每列總數(shù)的總和是確定的,因此自由度是行數(shù)-1和列數(shù)-1的乘積。如果第一個分類變量有r類,第二個分類變量有c類,那么自由度就是:海量管理資料下載,請登錄:汽車基地http://www.qcbase.com汽車基地htt
8、p://www.qcbase.com主機廠與供應(yīng)商的信息、服務(wù)、交流中心!,這時,我們查自由度為的分布,和前面一樣計算0.95得分位數(shù),就得到顯著性水平為5%的臨界