資源描述:
《卡方檢驗案例.ppt》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第九講卡方檢驗一、檢驗的功能1、適用資料─計數(shù)數(shù)據(jù)計數(shù)數(shù)據(jù)的統(tǒng)計分析,測量數(shù)據(jù)的統(tǒng)計方法并不適用,卡方檢驗是較為常用的一種方法。⑴擬合優(yōu)度檢驗[例]即通過實際調(diào)查與觀察所得到的一批數(shù)據(jù),其次數(shù)分布是否服從理論上所假定的某一概率分布;2、卡方檢驗的功能■例某廣播電視臺為了了解廣大兒童對其提供的6種兒童節(jié)目的偏好(態(tài)度),隨機抽取了300名兒童,問他們最喜歡哪一種節(jié)目(每人只能選一種),得到的數(shù)據(jù)如下表:節(jié)目1節(jié)目2節(jié)目3節(jié)目4節(jié)目5節(jié)目6858055104030問:就調(diào)查的300人而言,他們對6個節(jié)目的偏好(體現(xiàn)在人數(shù))是否存在顯著的差
2、異?⑵變量間的獨立性檢驗在對一批觀察數(shù)據(jù)進行雙向多項分類之后,這兩個分類特征是獨立無關(guān)的還是具有連帶相關(guān)的關(guān)系?■例某師范大學為了了解廣大師生對實行“中期選撥”制度的態(tài)度。曾以問卷調(diào)查的形式對977名低年級學生、790名高年級學生和764名教師進行隨機調(diào)查,調(diào)查結(jié)果:主要用于檢驗不同人群母總體在某一個變量上的反應是否有顯著差異。[例]從四所幼兒園分別隨機抽出6歲兒童若干,各自組成一個實驗組,進行識記測驗。測驗材料是紅、綠、藍三種顏色書寫的字母,以單位時間內(nèi)的識記數(shù)量為指標,結(jié)果如下。問四組數(shù)據(jù)是否可以合并分析。⑶同質(zhì)性檢驗分組紅色字母
3、綠色字母藍色字母124171921512932020144102528理論基礎(chǔ)是1899年皮爾遜的工作:在分布擬合優(yōu)度檢驗中,實際觀察次數(shù)與理論次數(shù)之差的平方除以理論次數(shù)近似服從分布,即:二、檢驗的基本原理-如果實際觀察次數(shù)與理論次數(shù)的差異越大,卡方檢驗的結(jié)果就越可能拒絕無差虛無)假設(shè)接受備擇假設(shè)。-理論次數(shù)越大()擬合效果越好。■注■注K為類別的數(shù)目;是實際觀察值;是理論(期待)次數(shù);是約束條件數(shù)或利用觀察數(shù)據(jù)時使用的樣本統(tǒng)計量的數(shù)目;1、卡方檢驗基本公式⑴分類相互排斥,互不包容;⑵觀察值相互獨立;⑶期望次數(shù)的大小應大于或等于5(較
4、好趨近卡方分布的前提);2、卡方檢驗的假設(shè)①自由度小時,必須,否則利用卡方檢驗需要進行較正或用精確的分布進行檢驗;②自由度大時,可以有少許類別的理論次數(shù)少于5;③應用卡方檢驗時,應注意取樣設(shè)計,保證取樣的代表性,否則依據(jù)卡方檢驗的結(jié)果難以保證結(jié)論的科學性;■注由于檢驗內(nèi)容僅涉及一個變量多項分類的計數(shù)資料,也稱one-waytest)1、配合度檢驗的一般問題即檢驗實際觀察數(shù)據(jù)的分布與某理論分布是否有顯著的差別。三、卡方檢驗應用一——總體分布的擬合檢驗(goodnessoffittest配合度檢驗)⑴統(tǒng)計假設(shè)2、檢驗過程即:實際觀察次數(shù)與
5、某分布理論次數(shù)之間無差異;⑶依統(tǒng)計檢驗公式,計算實得卡方值⑵數(shù)理基礎(chǔ)⑷作出統(tǒng)計決斷N:總數(shù)Pe:具體類別理論概率■例某項民意測驗,答案有同意、不置可否、不同意3種。調(diào)查了48人,結(jié)果同意的24人,不置可否的人12人,不同意的12人,問持這3種意見的人數(shù)是否存在顯著差異?3、離散型分布的擬合檢驗對于連續(xù)隨機變量的測量數(shù)據(jù),有時不知道其總體分布,需要根據(jù)樣本的次數(shù)分布的信息判斷其是否服從某種確定的連續(xù)性分布。⑴檢驗方法①將連續(xù)性的測量數(shù)據(jù)整理成次數(shù)分布表②畫出相應的次數(shù)分布曲線;③選擇恰當?shù)睦碚摲植迹虎苓M行擬合檢驗;4、連續(xù)型分布擬合檢驗
6、(例)■例:下表是552名學生的身高次數(shù)分布,問這些學生的身高分布是否符合正態(tài)分布?169~170215.383.030.002371166~167712.382.440.012017163~164229.381.850.04260240.167160~161576.381.260.10888600.150157~1581103.380.670.188581040.471154~1551240.380.070.235441300.277151~152112-2.62-0.520.206151140.035148~14980-5.62-
7、1.110.12746701.429145~14625-8.62-1.700.05562311.161142~1438-11.62-2.290.017109139~1404-14.62-2.880.003962身高組中值次數(shù)離均差Z分數(shù)P理論次數(shù)0.1250.09其一、分組數(shù)據(jù)第1組理論次數(shù)的計算注:=組上限的Z值-組下限的Z值其二、擬合指標卡方值的計算■分析5、二項分類的配合度檢驗與比率顯著檢驗⑴設(shè)總體比率為,且時■結(jié)論:Z檢驗與卡方檢驗一致(樣本比率p的真正分布是二項分布)男生女生某班有100名學生,男生的有42人,問男生的比率是
8、否與0.5有顯著差異?①比率顯著性檢驗42585050■例②用卡方檢驗(配合度)⑵當且時卡方檢驗公式當期望次數(shù)小于5時,卡方檢驗需要校正,Yates建議的校正公式為:■注:校正后的結(jié)果與二項分布的結(jié)果一致⑶的連續(xù)性校正(