資源描述:
《協(xié)方差分析(Analysis_of_Covariance)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、協(xié)方差分析AnalysisofCovarianceALBERTR.WLDTOLLIAHT報(bào)告人:白寅Mslab@TianjinUniv我們先來看一個(gè)問題:芬蘭由幾十個(gè)小的自治區(qū)組成。在芬蘭,白酒的批發(fā)和零售是國家壟斷的。幾個(gè)世紀(jì)以來,法律規(guī)定白酒只能在城市自治區(qū)中銷售。但是去年這條法律要做修改了,該國的相關(guān)部門嘗試性地在農(nóng)村自治區(qū)銷售白酒,進(jìn)而研究白酒的銷售方式是否會(huì)影響當(dāng)?shù)氐慕煌ㄊ鹿柿吭谌ツ晗奶?,他們?nèi)芜x12個(gè)農(nóng)業(yè)自治區(qū),在其中4個(gè)開設(shè)了白酒專賣店;另外4個(gè)授權(quán)飯店銷售白酒;余下的4個(gè)保持原來的狀態(tài),即禁止銷售白酒。開設(shè)白酒專賣店授
2、權(quán)飯店銷售保持禁銷白酒12個(gè)實(shí)驗(yàn)自治區(qū)為比較銷售白酒對交通事故是否有影響,我們搜集到三組實(shí)驗(yàn)區(qū)域一年后的交通事故發(fā)生數(shù):授權(quán)銷售白酒類型(要素水平)無授權(quán)開設(shè)白酒專賣店授權(quán)飯店代銷交通事故報(bào)告數(shù)177226226225196229167198215176206188每組平均事故數(shù)186.25206.50214.5012地區(qū)總平均事故數(shù)差異源SSdfMSFP-valueFcrit組間1696.1672848.08332.0793430.1809824.256495組內(nèi)3670.759407.8611銷售白酒對當(dāng)?shù)氐慕煌ㄊ鹿视杏绊憜??認(rèn)為
3、白酒的銷售沒有影響交通事故率。真的是這樣嗎?我們用學(xué)過的方差分析來比較一下各組均值,他們是:186.25,206.50,214.50F=2.079343<4.256495,接受原假設(shè),即H0:u1=u2=u3實(shí)驗(yàn)前后,同一地區(qū)的交通事故量應(yīng)該有某種聯(lián)系?。貧w關(guān)系銷售白酒后交通事故多的地區(qū)有可能是因?yàn)槠湓瓉斫煌ㄊ鹿示捅绕渌貐^(qū)多!是不是有些地區(qū)即使不賣白酒交通事故也會(huì)比其他地區(qū)多?稍加分析我們就會(huì)發(fā)現(xiàn),我們的分析有問題直接收集統(tǒng)計(jì)資料的有兩種方式:實(shí)驗(yàn)式和非實(shí)驗(yàn)式。如果條件可以完全控制的話(只一個(gè)因素變化,其他因素統(tǒng)一)實(shí)驗(yàn)式收集數(shù)
4、據(jù)進(jìn)行方差分析理論上是可以保證精度的。但是實(shí)驗(yàn)條件不能完全控制的時(shí)候就要采取統(tǒng)計(jì)控制,即用統(tǒng)計(jì)的方法排除數(shù)據(jù)中的干擾因素從而提高精度。——我們知道,就算12個(gè)地區(qū)白酒的銷售方式是隨機(jī)指定的,由于每組僅僅有四個(gè)地區(qū),很難保證三組地區(qū)的交通事故只與白酒的銷售有關(guān)而其他因素統(tǒng)一水平。協(xié)方差分析可以解決這類問題。各地的交通事故僅僅與飲酒有關(guān)嗎?各組數(shù)據(jù)可比嗎?比如人口多的地區(qū),車輛多的地區(qū),雨雪多的地區(qū)交通事故就會(huì)多協(xié)方差分析是如何解決這個(gè)問題的呢?第i組第j個(gè)觀測值隨機(jī)誤差第i組的組效應(yīng)一般均值方差分析的前提是除隨機(jī)誤差外,水平變量是影響觀
5、測值的唯一變量對于芬蘭白酒專賣的問題,交通事故顯然不是僅僅與銷售方式有關(guān),而把其他變量都?xì)w為隨機(jī)誤差又太過粗糙.這樣。我們就想到了引入其他變量.在協(xié)方差分析的模型中,我們稱之為協(xié)變量.下面我們再看協(xié)方差分析數(shù)據(jù)結(jié)構(gòu):首先,我們看看方差分析數(shù)據(jù)結(jié)構(gòu):“遺傳”效應(yīng)觀測值=一般均值+水平影響+協(xié)變量影響+隨機(jī)誤差協(xié)變量回歸系數(shù)協(xié)變量效應(yīng)可見,協(xié)方差分析將方差分析與回歸分析結(jié)合了起來.方差分析回歸分析從離差分解的角度我們來解釋協(xié)方差分析對于方差分析:總離差=分組變量離差+隨機(jī)誤差(組內(nèi)離差)對于協(xié)方差分析:總離差=分組變量離差+協(xié)變量離差+隨
6、機(jī)誤差在方差分析中,協(xié)變量離差包含在了隨機(jī)誤差中.在協(xié)方差分析中,單獨(dú)將其分離出來.于是,我們用協(xié)變量對觀測值進(jìn)行修正,去掉“遺傳”因素下面的問題是,如何計(jì)算回歸系數(shù)協(xié)變量修正后的觀測值去除遺傳效應(yīng)總思路在觀測值中去除協(xié)變量的影響之后,應(yīng)用方差分析我們把回歸系數(shù)的計(jì)算分為兩種情況計(jì)算總離差平方和時(shí):我們最終要檢驗(yàn)的是分組自變量對因變量有無顯著作用.原假設(shè)是無顯著作用.假設(shè)檢驗(yàn)以原命題為真為基礎(chǔ)進(jìn)行的.因此,這里我們認(rèn)為ti=0,即,用回歸模型計(jì)算回歸系數(shù).其最小二乘無偏估計(jì)值為由此我們可以計(jì)算總離差平方和的修正值:總離差平方和修正值的
7、定義和計(jì)算式如下:Y的回歸線與回歸線的離差平方和回歸平方和如果X對Y無作用,b=0,該項(xiàng)則為0為了簡化表示,我們定義當(dāng)計(jì)算組內(nèi)離差平方和時(shí),我們使用組內(nèi)回歸系數(shù) 它的計(jì)算如下:組內(nèi)離差平方和的修正值計(jì)算如下:在這里我們實(shí)際上是假設(shè)各組內(nèi)的回歸系數(shù)相等(協(xié)方差分析基本假設(shè))因而求出了一個(gè)統(tǒng)一的組內(nèi)回歸系數(shù).Yi的回歸線與回歸線的殘差平方和組內(nèi)總離差平方和回歸平方和同樣為了簡化表示,我們定義組內(nèi)總離差平方和從回歸角度看組內(nèi)殘差平方和組內(nèi)回歸平方和接著就要計(jì)算組間平方和了。它反映的是各個(gè)水平之間的差異有了這三個(gè)修正的平方和,我們就可以進(jìn)行
8、組間無差異的檢驗(yàn)了?;仡^從離差分解的角度我們來解釋協(xié)方差分析總離差=分組變量離差+協(xié)變量離差+隨機(jī)誤差分組變量離差=總離差-協(xié)變量離差-隨機(jī)誤差可解釋部分不可解釋部分我們回頭看協(xié)方差分析的模型使用該方法進(jìn)行分析的前提是每