資源描述:
《檢驗(yàn)和方差分析的原理和基本方法》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、《管理統(tǒng)計學(xué)》導(dǎo)學(xué)資料六——檢驗(yàn)和方差分析這一講的內(nèi)容包括兩個部分開平方檢驗(yàn)和方差分析,重點(diǎn)是方差分析,在本章的學(xué)習(xí)中,同學(xué)們要了解方差分析的用途,檢驗(yàn)的作用和用途。學(xué)會和掌握方差分析表的使用,了解自由度的計算和F檢驗(yàn)的作用,記住方差分析表中的五個等式和含義。本章的關(guān)鍵術(shù)語:方差分析(AnalysisofVariance,常簡稱為ANOVA)是用來檢驗(yàn)兩個以上樣本的均值差異的顯著程度,由此判斷樣本究竟是否抽自具有同一均值總體的方法?! ST-總離差方和(SumofSquareinTotal)為各樣本觀察值與總均值的離差平方和?! STR-組間離差方和(SumofSquareTreatme
2、nt)表示不同的樣本組之間,由于因素取不同的水平所產(chǎn)生的離差平方和。 SSE-組內(nèi)離差方和(SumofSquareError)表示同一樣本組內(nèi),由于隨機(jī)因素影響所產(chǎn)生的離差平方和,簡稱為組內(nèi)離差平方和。本章學(xué)完后,你應(yīng)當(dāng)能夠:1、掌握用檢驗(yàn)來解決獨(dú)立性檢驗(yàn)和擬合性檢驗(yàn)的原理和基本方法,能解決最常見的這類檢驗(yàn)問題。 2、了解和懂得單因素方差分析的原理和基本方法,能應(yīng)用計算機(jī)解決最常見的方差分析問題。一、檢驗(yàn)檢驗(yàn)的用途是檢驗(yàn)兩個變量之間的獨(dú)立性和檢驗(yàn)數(shù)據(jù)是否服從某個概率分布得擬合檢驗(yàn)。我們經(jīng)常會遇到受兩個或兩個以上因素(變量)影響的實(shí)驗(yàn)或觀察數(shù)據(jù),并要求判斷兩個變量之間是否存在相互聯(lián)系的問題
3、。如果兩個變量之間沒有聯(lián)系則稱作是獨(dú)立的,否則就是不獨(dú)立的。用分布可以檢驗(yàn)兩個變量之間的獨(dú)立性問題。此時我們首先將研究對象的觀察數(shù)據(jù)按兩個變量分別進(jìn)行分類。。例如,按行對第一個變量進(jìn)行分類,按列對第二個變量進(jìn)行分類。按這種方法把所有的試驗(yàn)觀察數(shù)據(jù)排列成的表稱為列聯(lián)表。獨(dú)立性檢驗(yàn)的程序和前面介紹的參數(shù)假設(shè)檢驗(yàn)一樣,首先也要建立假設(shè),然后計算檢驗(yàn)統(tǒng)計量的值。這次采用的檢驗(yàn)統(tǒng)計這次采用的檢驗(yàn)統(tǒng)計量就是,再根據(jù)問題規(guī)定的顯著性水平查分布表,得到當(dāng)原假設(shè)成立時檢驗(yàn)統(tǒng)計量允許的最大臨界值,與計算所得的值作比較,得出接受或拒絕原假設(shè)的結(jié)論。具體步驟如下:1.提出假設(shè):兩個變量是獨(dú)立的,即相互之間沒有影響,
4、:兩個變量是不獨(dú)立的,即相互之間有影響。檢驗(yàn)的結(jié)果如果接受原假設(shè)就說明不能推翻兩個變量是獨(dú)立的假設(shè);反之,拒絕,接受2將觀測數(shù)據(jù)分類,計算檢驗(yàn)統(tǒng)計量:我們要將需要檢驗(yàn)的變量分類,只作如下的表格:變量B的分類變量A的類別12…..m行總和1O11O12…..O1mO1.2O21O22…..O2mO2.…..…..…..…..…..kOk1Ok2…..OkmOk.列總和O.1O.2O.mn這里,Oij表示具有第ij屬性的觀測的數(shù)量,i=1,2,..k,j=1,2,…m,Oi.表示第i行的觀測書的總值,O.j表示第j列的觀測數(shù)的總數(shù)。注意,這里Oij是實(shí)際觀測到的數(shù)據(jù)分類得到的。我們在后面還
5、要計算在原假設(shè)成立的是觀測的理論數(shù)值。這里n是觀測的總數(shù)。定義=,這里是上邊分類得到的實(shí)際觀測數(shù),是與之相應(yīng)的位置上的期望值。是根據(jù)概率計算的,在原假設(shè)下兩個變量獨(dú)立,因而有:如果兩事件獨(dú)立,則它們的聯(lián)合概率就等于它們分別概率的乘積,即落入第ij格的概率等于落入第i行的概率與落入第j列的概率的乘積。由此可得到當(dāng)總的觀察值的和為n時,與觀察值相對應(yīng)的期望值可按下式計算得到。=()()=利用上面的公式可以計算出相應(yīng)的個各個位置上的期望值。如果計算所得到的期望值過小,則最后得到的檢驗(yàn)統(tǒng)計量就會估計過大,導(dǎo)致原假設(shè)被拒絕的概率過高。因此,實(shí)際檢驗(yàn)中一般要求所有計算得到的期望值都不小于5。如果某些
6、位置上的期望值小于5就可以把相鄰的類別合并,使得結(jié)果計算得到的期望值都不小于5。3計算檢驗(yàn)我們在上邊計算的值,就是反映兩個變量獨(dú)立性程度的變量。如果=0,那么這兩個變量獨(dú)立,當(dāng)不等于0,越大兩個變量獨(dú)立的可能性越小,當(dāng)達(dá)到一定的程度時我們就可以拒絕兩個變量獨(dú)立的假設(shè)。為了確定這個臨界值,我們就需要使用分布。首先我們需要確定的自由度,由于在計算期望值的時候,每行總數(shù)和每列總數(shù)的總和是確定的,因此自由度是行數(shù)-1和列數(shù)-1的乘積。如果第一個分類變量有r類,第二個分類變量有c類,那么自由度就是:,這時,我們查自由度為的分布,和前面一樣計算0.95得分位數(shù),就得到顯著性水平為5%的臨界值,
7、如果我們在第2布計算的,那么我們就要拒絕原假設(shè),不能接受兩個變量獨(dú)立。此外,分布也可以用來檢驗(yàn)數(shù)據(jù)是否服從某個分布,如正態(tài)分布,泊松分布,二項(xiàng)分布等。這時的檢驗(yàn)也成為擬和優(yōu)度檢驗(yàn)。這種檢驗(yàn)的方法也是先將變量分類,計算理論值和觀測值,在計算統(tǒng)計量和自由度。具體的操作辦法感興趣的同學(xué)可以參看課本和課件。二、方差分析方差分析主要用來檢驗(yàn)兩個以上樣本的均值差異的顯著程度,由此判斷樣本究竟是否抽自具有同一均值的總體。方