資源描述:
《變異數(shù)分析(精品).doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、變異數(shù)分析1基本槪念一'硏究之問題(ANOVA之用途)變異數(shù)分析(AnalysisOfVariation,ANOVA):檢定三個(gè)或三個(gè)以上的母體平均數(shù)是否相等的方法,或檢定因子(FnctoC對(duì)依變數(shù)是否有影響。變異數(shù)分析是一種統(tǒng)計(jì)分析的方法,係將一組資料的變異,依可能發(fā)生的變異來源,分割爲(wèi)數(shù)個(gè)部份,亦即每一部份均可歸因於某原因(變異來源);測度這些不同的變異來源,可瞭解各種變異是否有顯著差異;若有差異,則表示某依變異來源對(duì)資料具有顯著的影響作用。若有K個(gè)母體資料時(shí),欲比較此K個(gè)母體的母體平均數(shù)(I二1,2,…,恥是
2、否相等(I.E.Ho:A=???=“*)°二、ANOVA之前題假設(shè)1?常態(tài)性假設(shè)(Normality)-假設(shè)K個(gè)母體分布均爲(wèi)常態(tài)分布2.同質(zhì)性假ix(Homogeneity)-假設(shè)K個(gè)常態(tài)母體分布之變異數(shù)均相等3.獨(dú)立性假設(shè)(Independence)-假設(shè)K個(gè)常態(tài)母體分布互相均獨(dú)立這些假設(shè)理論上都可利用原始數(shù)據(jù)一一加以檢定。如果三個(gè)母體的平均數(shù)相等,則我們將預(yù)測三個(gè)樣本平均數(shù)會(huì)非常接近。事實(shí)上,此三樣本平均數(shù)愈靠近,愈能支持母體平均數(shù)爲(wèi)相等的結(jié)論。換句話說,樣本平均數(shù)間的差異愈大,則愈能支持母體平均數(shù)爲(wèi)不相等的結(jié)
3、論。所以,如果樣本平均數(shù)間的變異性「低」,則支持H();如果樣本平均數(shù)間的變異性「高」,則支持7。若虛無假設(shè)仏:m=心爲(wèi)真,我們可利用樣本平均數(shù)間的變異性建立;的估計(jì)値。而且果滿足變異數(shù)分析的前捉假定的話,各樣本將來自平均數(shù)爲(wèi)卩且變異數(shù)爲(wèi)/的同一常態(tài)分配。我們曾提到對(duì)抽自常態(tài)母體且樣本大小爲(wèi)N之簡單隨機(jī)樣本而言,其樣本個(gè)均數(shù)乂的抽樣分配爲(wèi)平均數(shù)爲(wèi)卩且變異數(shù)爲(wèi)/的常態(tài)分配。/的樣本間估計(jì)値係根據(jù)虛無假設(shè)爲(wèi)真的假設(shè)。在這種情況下,各樣本來自同一母體,而且僅有一個(gè)乂的抽樣分配。爲(wèi)說明H°爲(wèi)僞的情況'假設(shè)母體平均都不相等。
4、由於三組樣本抽自平均數(shù)不等的常態(tài)母體,將有不同的抽樣分配。一般而言'當(dāng)母體平均數(shù)不等時(shí)'樣本間估計(jì)値將高估母體變異數(shù)/各樣本內(nèi)的變異性也會(huì)影響變異數(shù)分析的結(jié)論。當(dāng)由各母體抽取?簡單隨機(jī)樣本時(shí),各樣本變異數(shù)均爲(wèi)/的一不偏估計(jì)値,所以我們可以將個(gè)別的/估計(jì)値合倂爲(wèi)一個(gè)總估計(jì)値,此估計(jì)値稱爲(wèi)/的合倂估計(jì)値或樣本內(nèi)(Within-Samples)估計(jì)値。因爲(wèi)各樣本變異數(shù)係以該樣本內(nèi)的變異爲(wèi)準(zhǔn),所以/的樣本內(nèi)估計(jì)値將不受母體平均數(shù)是否相等所影響。當(dāng)樣本大小相等時(shí),/的樣本內(nèi)估計(jì)値即爲(wèi)個(gè)別樣本變異數(shù)的平均無論如何,若虛無假設(shè)爲(wèi)
5、真,則樣本間估計(jì)値爲(wèi)/的良好估計(jì)値;而若虛無假設(shè)爲(wèi)僞時(shí),樣本間估計(jì)値將高估/。在任一情況下,樣本內(nèi)估計(jì)値均爲(wèi)/的良好估計(jì)値。因此,如果虛無假設(shè)爲(wèi)真,這兩個(gè)估計(jì)値應(yīng)非常類似,且其比率將接近1。如果虛無假設(shè)爲(wèi)僞,則樣本間估計(jì)値將大於樣本內(nèi)估計(jì)値,其比率將會(huì)總之,ANOVA的論理是以建立共同母體變異數(shù)/的二獨(dú)立估計(jì)値爲(wèi)依據(jù)。其屮一個(gè)估計(jì)値是以樣本平均數(shù)間的變異爲(wèi)準(zhǔn),而另一個(gè)估計(jì)値則以各樣本內(nèi)的資料變異爲(wèi)準(zhǔn)。藉著此二/估計(jì)値的比較,我們將能判定樣本平均數(shù)是否相等。由於其方法利用到變異數(shù)的比較,所以稱爲(wèi)變異數(shù)分三、資料型態(tài)及
6、符號(hào)母體分布原始資料(X”)個(gè)數(shù)(?,)各組資料總和(X,)1N(“q2)~Xh,X]2,?..YX.2■■N(“2,b~)~X?],X??,.??????兒勺■■X2.??■K??N(慫&)?…,X*”*■nk?X”.合計(jì)NX四、統(tǒng)計(jì)假設(shè)I^0:"1=“2=???=“*1:…,“火(不完金相等)當(dāng)接受丹。時(shí)表示K個(gè)母體可以合倂爲(wèi)一母體;若拒絕0)時(shí)則表示各母體之間平均數(shù)是有差異,至於何者較大或較小,並無法在此假設(shè)中判定,必須做進(jìn)一步分析。五、統(tǒng)計(jì)模式Xij=/<+勺傳統(tǒng)上我們會(huì)用下面的寫法,令必/+〃2“2+?
7、??+5從n則Xjj="+勺=“+(“-“)+6j而h():=“2=???=“&就變成:勺=?2=^'=ak=0其屮,“爲(wèi)整體之母體的「總」平均數(shù)(注意到用觀測値心加權(quán))叢爲(wèi)第i組母體之平均數(shù)乞爲(wèi)第i組之處理效應(yīng)(treatmenteffect)i.i.d?勺爲(wèi)第,組第M固樣本之誤差(”w)勺?n(o,/)這裡的等都被視爲(wèi)未知參數(shù)(非隨機(jī)量),而勺是隨機(jī)量。云也是未知參數(shù)。在傳統(tǒng)的ANOVA分析屮有一個(gè)相當(dāng)重要的假設(shè)就是:所有的勺都有同樣的/。六、統(tǒng)計(jì)推論(固定效應(yīng)模式(FixedEffectModel))點(diǎn)估計(jì):
8、首先將匕視爲(wèi)一固定未知參數(shù)。利用最小平方法(LeastSquareMethod)令:/=!>1使Q極小,用偏微分,首先做徑二f£2(X"—“—%)(—1)=0c“1=1>1由吐得kX..-必-工昭=0(1)f=l其次做學(xué)二丈2(X廠“-Q(-1)=0cq>1由吐得Xj.=0(2)但k工昭=0/=!(3)將(3)代入(1),得X..=np故—X..(4)再由(