資源描述:
《自由度概念深析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、關(guān)于“自由度”的幾個問題探析李文華內(nèi)容提要:本文探討了如下幾個相關(guān)的問題:什么是“自由度”?怎樣計算“自由度”?“自由度”對于統(tǒng)計學(xué)有什么作用?關(guān)鍵詞:自由度抽樣分布假設(shè)檢驗Abstract:Threeissuesthatarecorrelativehavebeendiscussedinthisarticle.Theseissuesare:Whatisdegreeoffreedom?Howtocalculatedegreeoffreedom?Whatisthesignificanceofdegreeoffreedomtostatistics?Keywords:D
2、egreeoffreedom;Sampledistribution;Hypothesistest在統(tǒng)計學(xué)中,有一個很難理解的概念——“自由度”(degreeoffreedom)o這里,筆者就如下兒個相關(guān)的問題發(fā)表一些不成熟的意見,請教方家。一、什么是“自由度”?“自由度”是指當(dāng)以樣本的統(tǒng)計量來估計總體的參數(shù)吋,樣本中獨立或能自曲變化的數(shù)據(jù)的個數(shù)。這個定義町以從如下2個方面來理解:第一,“統(tǒng)計量”(如樣本數(shù)據(jù)的平均數(shù)尢、樣本數(shù)據(jù)的標(biāo)準(zhǔn)差、口和宀左通過調(diào)查樣本的數(shù)據(jù)人為地計算出來的,而“參數(shù)”(如總體均值“、)差5)是被調(diào)查的總體所客觀存在的,這是兩者的區(qū)別。⑴在統(tǒng)
3、計學(xué)的理論層而上,耍求或者假定統(tǒng)計量是參數(shù)的無偏估計,認(rèn)為二者是相等的(在實際研究中,由丁抽樣的偏差,可能導(dǎo)致兩者不相等,但對于這種情況,研究者是無法知道的,知道就沒有抽樣調(diào)查的必要了)。在理論假設(shè)下,統(tǒng)計量也就和參數(shù)一樣被看作是客觀的、確定的。第二,既然在理論上統(tǒng)計量被要求是確定的,那么在實際層面上,計算統(tǒng)計量的那組數(shù)據(jù)就不是完全自曲的。這一點很重要,因為“自出度”中“自由”的含義就是相對這個“確定”條件而言的。正是統(tǒng)計量的這種“確定性”限制了與z相關(guān)的一組數(shù)據(jù)的“自由度”,也就是說,一組數(shù)據(jù)不是可以完全自由取值的,它必須支持“統(tǒng)計量與總體參數(shù)相等”的理論假設(shè)
4、。這就是“自由度”存在的理由。有必要舉例來進(jìn)一步說明“獨立或能口由變化的數(shù)據(jù)”的含義。在心理、社會等領(lǐng)域的測量或者調(diào)杳過程中,研究者設(shè)置了一些變量(如智商、收入等),這些變量是隨機變量。所謂隨機變量是指,在調(diào)查總體屮,變量的取值范圍及其所對應(yīng)的頻次(兩者合起來稱為變量的分布)是確定的,但在一次具體的抽樣調(diào)查中,變量的取值及其所對應(yīng)的頻次則是不確定的,但在大樣本的抽樣調(diào)查中,變量的分布又是能體現(xiàn)總體的特征和規(guī)律的。例仁研究者調(diào)查某個城市在崗職女工的平均收入,從總體40000萬人屮,研究者隨機抽取了200人進(jìn)行調(diào)查。在這個例子屮,總體40000個在崗女工的收入的平均
5、數(shù)是總體參數(shù),是客觀的、確定的,盡管研究者不知道。通過隨機抽樣和問卷調(diào)查,研究者獲得了200人的收入的數(shù)據(jù)。運用這組數(shù)據(jù)可以算出樣木的平均數(shù),它是統(tǒng)計量。由于在理論上要求統(tǒng)計量與參數(shù)相等,所以這200個數(shù)據(jù)屮只冇199個數(shù)據(jù)可以“自由”變動,所以,這組數(shù)據(jù)在求平均數(shù)這個統(tǒng)計量時的自由度就是:K=200-1=199o笫三,在上面的例子中,研究者只抽了一個200人的樣本,而在實際層面,這200人的收入是確定的,因為每個被調(diào)查者只有一個確定的收入。既然這樣,“199個數(shù)據(jù)可以自由變動”是什么意思呢?這需要回到理論上去回答。在理論上,從20000人中隨機抽取200人冇C
6、囂0。種抽取方法,也就是說,在理論上研究者可以得到c芻oo個不同的、樣本容量均為200人的樣本,這個數(shù)據(jù)量是很大的(沒有必要確切知道它的值)。這樣,在理論上就存在很多組調(diào)查數(shù)據(jù)(雖然研究者確實只調(diào)查了一個200人的樣木,也只獲得了一組整據(jù)),每組都有200個數(shù)據(jù)。每組數(shù)據(jù)在理論上都冇對應(yīng)的統(tǒng)計量(如平均數(shù)疋),正是這些統(tǒng)計量的分布,構(gòu)成了統(tǒng)計學(xué)屮所說的抽樣分布,它是基礎(chǔ)統(tǒng)計學(xué)的核心內(nèi)容。所以,僅僅在理論上,這200個數(shù)據(jù)屮的199個數(shù)據(jù)是可以隨不同樣本而變化的、自由的。當(dāng)然,話說冋來,這種自由并非是絕對的,它們也只能在總體的取值范圍內(nèi)變動,例如,關(guān)于“收入”這個
7、變量的取值就不可能為負(fù)值。第四,“自由度”是誰的?從前面的分析中可以知道,“自由度”產(chǎn)生于這樣的背景下:運用一組數(shù)據(jù)來求“統(tǒng)計量”。離開“一組數(shù)據(jù)”就不可能冇“統(tǒng)計量”,不計算“統(tǒng)計量”,“一組數(shù)據(jù)”就失去了科學(xué)的價值。所以,“自由度”應(yīng)該是“統(tǒng)計量”和“一組數(shù)據(jù)”所共同擁有的。當(dāng)然,為了方便,我們說“統(tǒng)計量的自由度”或者“一組數(shù)據(jù)的自由度”也都是可以接受的。二、如何計算“自由度”?自由度的大小與計算統(tǒng)計量時的確定條件的數(shù)目成反比,計算某個統(tǒng)計量的口由度,原則上是用數(shù)據(jù)的個數(shù)減去“確定”條件的個數(shù)。但說起來容易算起來難。常見的統(tǒng)計量有平均數(shù)〒、樣本標(biāo)準(zhǔn)差s、M直
8、、X2(卡方)值、F值等