資源描述:
《卡方檢驗(yàn) 應(yīng)用》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、第八章記數(shù)數(shù)據(jù)統(tǒng)計(jì)法—卡方檢驗(yàn)法知識引入在各個(gè)研究領(lǐng)域中,有些研究問題只能劃分為不同性質(zhì)的類別,各類別沒有量的聯(lián)系。例如,性別分男女,職業(yè)分為公務(wù)員、教師、工人、……,教師職稱又分為教授、副教授、……。有時(shí)雖有量的關(guān)系,因研究需要將其按一定的標(biāo)準(zhǔn)分為不同的類別,例如,學(xué)習(xí)成績、能力水平、態(tài)度等都是連續(xù)數(shù)據(jù),只是研究者依一定標(biāo)準(zhǔn)將其劃分為優(yōu)良中差,喜歡與不喜歡等少數(shù)幾個(gè)等級。對這些非連續(xù)等距性數(shù)據(jù),要判別這些分類間的差異或者多個(gè)變量間的相關(guān)性方法稱為計(jì)數(shù)數(shù)據(jù)統(tǒng)計(jì)方法。 卡方檢驗(yàn)是專用于解決計(jì)數(shù)數(shù)據(jù)統(tǒng)計(jì)分析的假設(shè)檢驗(yàn)法。本章主要介
2、紹卡方檢驗(yàn)的兩個(gè)應(yīng)用:擬合性檢驗(yàn)和獨(dú)立性檢驗(yàn)。擬合性檢驗(yàn)是用于分析實(shí)際次數(shù)與理論次數(shù)是否相同,適用于單個(gè)因素分類的計(jì)數(shù)數(shù)據(jù)。獨(dú)立性檢驗(yàn)用于分析各有多項(xiàng)分類的兩個(gè)或兩個(gè)以上的因素之間是否有關(guān)聯(lián)或是否獨(dú)立的問題?! ≡谟?jì)數(shù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析時(shí)要特別注意取樣的代表性。我們知道,統(tǒng)計(jì)分析就是依據(jù)樣本所提供的信息,正確推論總體的情況。在這一過程中,最根本的一環(huán)是確保樣本的代表性及對實(shí)驗(yàn)的良好控制。在心理與教育研究中,所搜集到的有些數(shù)據(jù)屬于定性資料,它們常常是通過調(diào)查、訪問或問卷獲得,除了少數(shù)實(shí)驗(yàn)可以事先計(jì)劃外,大部分收集數(shù)據(jù)的過程是難于
3、控制的。例如,某研究者關(guān)于某項(xiàng)教育措施的問卷調(diào)查,由于有一部分教師和學(xué)生對該項(xiàng)措施存有意見,或?qū)柧肀旧碛衅?,根本就不填寫問卷。這樣該研究所能收回的問卷只能代表一部分觀點(diǎn),所以它是一個(gè)有偏樣本,若據(jù)此對總體進(jìn)行推論,就會產(chǎn)生一定的偏差,勢必不能真實(shí)地反映出教師與學(xué)生對這項(xiàng)教育措施的意見。因此應(yīng)用計(jì)數(shù)資料進(jìn)行統(tǒng)計(jì)推斷時(shí),要特別小心謹(jǐn)慎,防止樣本的偏倚性,只有具有代表性的樣本才能作出正確的推論。第一節(jié)卡方擬合性檢驗(yàn)一、卡方檢驗(yàn)的一般問題 卡方檢驗(yàn)應(yīng)用于計(jì)數(shù)數(shù)據(jù)的分析,對于總體的分布不作任何假設(shè),因此它又是非參數(shù)檢驗(yàn)法中的一種。它
4、由統(tǒng)計(jì)學(xué)家皮爾遜推導(dǎo)。理論證明,實(shí)際觀察次數(shù)(fo)與理論次數(shù)(fe),又稱期望次數(shù))之差的平方再除以理論次數(shù)所得的統(tǒng)計(jì)量,近似服從卡方分布,可表示為: 這是卡方檢驗(yàn)的原始公式,其中當(dāng)fe越大(fe≥5),近似得越好。顯然fo與fe相差越大,卡方值就越大;fo與fe相差越小,卡方值就越?。灰虼怂軌蛴脕肀硎緁o與fe相差的程度。根據(jù)這個(gè)公式,可認(rèn)為卡方檢驗(yàn)的一般問題是要檢驗(yàn)名義型變量的實(shí)際觀測次數(shù)和理論次數(shù)分布之間是否存在顯著差異。它主要應(yīng)用于兩種情況: 卡方檢驗(yàn)?zāi)軝z驗(yàn)單個(gè)多項(xiàng)分類名義型變量各分類間的實(shí)際觀測次數(shù)與理論次數(shù)之
5、間是否一致的問題,這里的觀測次數(shù)是根據(jù)樣本數(shù)據(jù)得多的實(shí)計(jì)數(shù),理論次數(shù)則是根據(jù)理論或經(jīng)驗(yàn)得到的期望次數(shù)。這一類檢驗(yàn)稱為擬合性檢驗(yàn)?! M合性檢驗(yàn)的零假設(shè)是觀測次數(shù)與理論次數(shù)之間無差異。其中理論次數(shù)的計(jì)算一般是根據(jù)某種理論,按一定的概率通過樣本即實(shí)際觀測次數(shù)來計(jì)算。這里所說的某種理論,可能是經(jīng)驗(yàn)規(guī)律,也可能是理論分布。確定理論次數(shù)是卡方檢驗(yàn)的關(guān)鍵?! M合性檢驗(yàn)自由度的確定與兩個(gè)因素有關(guān):一是分類的項(xiàng)數(shù),二是在計(jì)算理論次數(shù)時(shí),所用統(tǒng)計(jì)量或約束條件的個(gè)數(shù),這兩者之差即為自由度。由于一般情況下,計(jì)算理論次數(shù)時(shí)只用到“總數(shù)”這一統(tǒng)計(jì)量,所
6、以自由度一般是分類的項(xiàng)數(shù)減1。但在對連續(xù)數(shù)據(jù)分布的配合度檢驗(yàn)中,常常會用數(shù)據(jù)個(gè)數(shù)、平均數(shù)、標(biāo)準(zhǔn)差等統(tǒng)計(jì)量來計(jì)算理論次數(shù),所以此時(shí)的自由度應(yīng)從總分類項(xiàng)中減去更多的個(gè)數(shù)。按照檢驗(yàn)中理論次數(shù)的定義不同,擬合性檢驗(yàn)有以下集中應(yīng)用。? 二、檢驗(yàn)無差假設(shè) 所謂無差假設(shè),是指各項(xiàng)分類的實(shí)計(jì)數(shù)之間沒有差異,也就是說各項(xiàng)分類之間的概率相等(均勻分布),因此理論次數(shù)完全按概率相等的條件來計(jì)算。即任一項(xiàng)的理論次數(shù)都等于總數(shù)/分類項(xiàng)數(shù)。因此自由度也就等于分類項(xiàng)數(shù)減1?! 纠?】隨機(jī)地將麻將色子拋擲300次,檢驗(yàn)該色子的六個(gè)面是否均勻。結(jié)果1-
7、6點(diǎn)向上的次數(shù)依次是,43,49,56,45,66,41?! 〗猓好總€(gè)類的理論次數(shù)是300/6=50,代入公式: 因此,在0.05的顯著性水平下,可以說這個(gè)色子的六面是均勻的?! 纠?】隨機(jī)抽取60名高一學(xué)生,問他們文理要不要分科,回答贊成的39人,反對的21人,問對分科的意見是否有顯著的差異?! 〗猓喝绻麤]有顯著的差異,則贊成與反對的各占一半,因此是一個(gè)無差假設(shè)的檢驗(yàn),于是理論次數(shù)為60/2=30,代入公式: 所以對于文理分科,學(xué)生們的態(tài)度是有顯著的差異的。? 三、檢驗(yàn)假設(shè)分布的概率 這里的假設(shè)分布可以是經(jīng)驗(yàn)性的,也
8、可以是某理論分布。公式中所需的理論次數(shù)則按照這里假設(shè)的分布進(jìn)行計(jì)算。 【例3】國際色覺障礙討論會宣布,每12個(gè)男子中,有一個(gè)是先天性色盲。從某校抽取的132名男生中有4人是色盲,問該校男子色盲比率與上述比例是否有顯著差異? 解:按國際色覺障礙討論會的統(tǒng)計(jì)結(jié)果