資源描述:
《測量的信度和效度》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、社會科學研究中.任何一種梢確的、系統(tǒng)的經(jīng)驗研究實際上都離不開社會側(cè)峨。對于任何的側(cè)敏而育,都會面臨一些摹本的問題,那就是:研究所得的資料或者說是數(shù)據(jù)是否是我們感興趣的資料或數(shù)據(jù)?它們能否準確地反映我們感興趣的問題?在相同的研究條件下,不同的研究者能否得出相同的研究結(jié)論?所有這些問題.都涉及到測最手段或測全工具的信度與效度問題。一、測一的信度(一)信度的意義信度(reliability)即可靠性,它是指對同一或相近的測量對象進行反復側(cè)量時,所得側(cè)量結(jié)果的一致性或穩(wěn)定性,也就是側(cè)量工具能夠毯定地測量所側(cè)的變量的程度。例如,我們用同一臺磅秤去稱一個人的體重,結(jié)果今天測得體重是即公斤.明天仍然是即公
2、斤,稱了好幾次的結(jié)果都是相同的,那我們就可以說這臺磅秤可信。若明天所稱體重變成88公斤而不再是80公斤,連稱幾次結(jié)果都不間,經(jīng)驗告訴我們這臺磅秤不準,出間題了.也就是這臺磅秤缺乏信度。這里要注意,信度只是一個評估側(cè)最是否具有穩(wěn)定性與一致性的概念.只要是經(jīng)反復測量結(jié)果一致,我們就認為該側(cè)量是可信的,而不管側(cè)量對象的真實悄況是怎樣的。例如.經(jīng)反復測量.稱得某人的體重都是80公斤,我們就可以說這臺磅秤有信度,而不管這個人的真實體重是80公斤還是88公斤。也就是說,一種測最手段完全可能是可信而非有效的。也就是說信度與效度的關(guān)系其有不對稱性,因為有效度必然意味著有信度,一種有效度的側(cè)最在任何時候都是正
3、確的,也必定是可信的,反之則不成立。另外,我們評估效度和信度的成功程度直接取決于測量所要求的精確度。比如說,如果今天測得某人的體重為80公斤,明天測得為82公斤,如果我們要求的精確度為正負不超過0.5公斤,那么我們就可以得出這臺磅秤不準、不可信的結(jié)論。而現(xiàn)在我們的側(cè)量要求是只要結(jié)果在正負5公斤之內(nèi)就好,那我們又完全可以說這臺磅秤側(cè)量的信度還是很高的。在社會科學研究中,我們通常以信度系數(shù)(r)來評估信度的大小。所謂信度系數(shù).是指用同一樣本所得到的兩組資料的相關(guān)系數(shù),它經(jīng)常被用做側(cè)且一致性的指標。信度系數(shù)高說明側(cè)量的一致性程度高,側(cè)全誤差小。例如,當r=0.50時,就是說測量中有50%的差異是來
4、自測最對象本身的差異,同樣有50%的差異來自測量對象之外,后者我們稱之為測量誤差。若出現(xiàn)這種結(jié)果,說明側(cè)量就不算成功。那么信度系數(shù)多大才能算高,才有信度呢?當r=1.00時表示無側(cè)量誤差.所有的差異都來自側(cè)量對象本身,這當然是測最的理想狀態(tài);當r二0時,表示側(cè)量游離于測量對象之外,側(cè)量結(jié)果與側(cè)量對象毫無關(guān)聯(lián),這一悄況不應(yīng)在研究中出現(xiàn)。一般來說,當r>!0.80時,就可以說該側(cè)量達到了足夠的信度。(二)信度的類型在實際研究中,人們往往從不同方面來檢驗和評估研究資料的信度,因而信度也就被分為不同類型。最基本、最常見的信度分類主要有三種:再側(cè)信度、復本信度和折半信度。I再測信度。所謂再側(cè)信度,是指
5、用相同的方法對同一測最對象先后進行兩次測量.并根據(jù)兩次側(cè)量結(jié)果計算其相關(guān)系數(shù)。這是社會科學研究中最普通、最常用的信度評估方法。例如前面講述的對體重的測量。應(yīng)當注意的是,使用這一方法時.前后兩次測量所應(yīng)用的方法應(yīng)該完全相同,淵盤的也應(yīng)該是同一側(cè)量對象,它必須遵循嚴格的條件限制。再測信度的優(yōu)點在于能夠提供有關(guān)側(cè)且結(jié)果是否隨時間而變異的資料。但同時,再測效度極易受時間因紊的制約。在社會科學研究中,如果前后兩次測量間隔時間過短,測址客體對前一次測量尚有記憶,那么回答者可以會憑記憶作答或者受其他心理因家的于擾,這樣所得信度系數(shù)本身的可信度就值得懷疑。但如果時間隔的太久,即使我們前后兩次測量都嚴格遵循了
6、洲量的要求.而這時我們又得出了相去甚遠的結(jié)論,信度系數(shù)比較小,我們?nèi)匀粺o法知道兩次測量的信度的真實程度。最適宜的相隔時間隨測驗的目的和淵驗的性質(zhì)而異,少則幾天,多則半年,甚至一兩年。z.復本信度。既然再測信度如此受時間限制.那么如果我們有兩套效果相等的測量復本,則可交替使用,根據(jù)一個側(cè)量對象對兩種復本測驗所得的結(jié)果計算其相關(guān)系數(shù),即可得復本信度。學??荚嚠斨薪?jīng)常采用的A,B卷就是理想的復本模型。它是根據(jù)測盈的目的,制作兩套等值的測量工具,對同一對象進行測量,然后比較兩套側(cè)最工具所得側(cè)最結(jié)果計算信度系數(shù)的方法。例如.在一次問卷調(diào)查中研究者同時應(yīng)用A,B兩套問卷,如果被試者在A,B兩卷上的得分相
7、同,就說明該問卷具有復本信度;如果兩者差異很大,則缺乏復本信度。應(yīng)當注意,復本信度雖然可以避免再側(cè)效度過分受時間限制的缺點,但同時要保證使用的必須是真正的復本,兩者在題目類型、數(shù)量、內(nèi)容及難度等方面都要一致。3.折半信度。如果一種淵量既沒有復本又只能測量一次,這種情況下研究者通常采用折半法來估計側(cè)量的信度。所謂折半信度是指,研究者根據(jù)一次測里結(jié)果,將項目分成兩組.并對兩組項目的值計算得出其相關(guān)系數(shù)。通常的做法