資源描述:
《自由度概念深析》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、關(guān)于“自由度”的幾個(gè)問題探析李文華內(nèi)容提要:本文探討了如下幾個(gè)相關(guān)的問題:什么是“自由度”?怎樣計(jì)算“自由度”?“自由度”對于統(tǒng)計(jì)學(xué)有什么作用?關(guān)鍵詞:自由度抽樣分布假設(shè)檢驗(yàn)Abstract:Threeissuesthatarecorrelativehavebeendiscussedinthisarticle.Theseissuesare:Whatisdegreeoffreedom?Howtocalculatedegreeoffreedom?Whatisthesignificanceofdegreeoffreedomtostatistics?Keywords:D
2、egreeoffreedom;Sampledistribution;Hypothesistest在統(tǒng)計(jì)學(xué)中,有一個(gè)很難理解的概念——“自由度”(degreeoffreedom)o這里,筆者就如下兒個(gè)相關(guān)的問題發(fā)表一些不成熟的意見,請教方家。一、什么是“自由度”?“自由度”是指當(dāng)以樣本的統(tǒng)計(jì)量來估計(jì)總體的參數(shù)吋,樣本中獨(dú)立或能自曲變化的數(shù)據(jù)的個(gè)數(shù)。這個(gè)定義町以從如下2個(gè)方面來理解:第一,“統(tǒng)計(jì)量”(如樣本數(shù)據(jù)的平均數(shù)尢、樣本數(shù)據(jù)的標(biāo)準(zhǔn)差、口和宀左通過調(diào)查樣本的數(shù)據(jù)人為地計(jì)算出來的,而“參數(shù)”(如總體均值“、)差5)是被調(diào)查的總體所客觀存在的,這是兩者的區(qū)別。⑴在統(tǒng)
3、計(jì)學(xué)的理論層而上,耍求或者假定統(tǒng)計(jì)量是參數(shù)的無偏估計(jì),認(rèn)為二者是相等的(在實(shí)際研究中,由丁抽樣的偏差,可能導(dǎo)致兩者不相等,但對于這種情況,研究者是無法知道的,知道就沒有抽樣調(diào)查的必要了)。在理論假設(shè)下,統(tǒng)計(jì)量也就和參數(shù)一樣被看作是客觀的、確定的。第二,既然在理論上統(tǒng)計(jì)量被要求是確定的,那么在實(shí)際層面上,計(jì)算統(tǒng)計(jì)量的那組數(shù)據(jù)就不是完全自曲的。這一點(diǎn)很重要,因?yàn)椤白猿龆取敝小白杂伞钡暮x就是相對這個(gè)“確定”條件而言的。正是統(tǒng)計(jì)量的這種“確定性”限制了與z相關(guān)的一組數(shù)據(jù)的“自由度”,也就是說,一組數(shù)據(jù)不是可以完全自由取值的,它必須支持“統(tǒng)計(jì)量與總體參數(shù)相等”的理論假設(shè)
4、。這就是“自由度”存在的理由。有必要舉例來進(jìn)一步說明“獨(dú)立或能口由變化的數(shù)據(jù)”的含義。在心理、社會等領(lǐng)域的測量或者調(diào)杳過程中,研究者設(shè)置了一些變量(如智商、收入等),這些變量是隨機(jī)變量。所謂隨機(jī)變量是指,在調(diào)查總體屮,變量的取值范圍及其所對應(yīng)的頻次(兩者合起來稱為變量的分布)是確定的,但在一次具體的抽樣調(diào)查中,變量的取值及其所對應(yīng)的頻次則是不確定的,但在大樣本的抽樣調(diào)查中,變量的分布又是能體現(xiàn)總體的特征和規(guī)律的。例仁研究者調(diào)查某個(gè)城市在崗職女工的平均收入,從總體40000萬人屮,研究者隨機(jī)抽取了200人進(jìn)行調(diào)查。在這個(gè)例子屮,總體40000個(gè)在崗女工的收入的平均
5、數(shù)是總體參數(shù),是客觀的、確定的,盡管研究者不知道。通過隨機(jī)抽樣和問卷調(diào)查,研究者獲得了200人的收入的數(shù)據(jù)。運(yùn)用這組數(shù)據(jù)可以算出樣木的平均數(shù),它是統(tǒng)計(jì)量。由于在理論上要求統(tǒng)計(jì)量與參數(shù)相等,所以這200個(gè)數(shù)據(jù)屮只冇199個(gè)數(shù)據(jù)可以“自由”變動,所以,這組數(shù)據(jù)在求平均數(shù)這個(gè)統(tǒng)計(jì)量時(shí)的自由度就是:K=200-1=199o笫三,在上面的例子中,研究者只抽了一個(gè)200人的樣本,而在實(shí)際層面,這200人的收入是確定的,因?yàn)槊總€(gè)被調(diào)查者只有一個(gè)確定的收入。既然這樣,“199個(gè)數(shù)據(jù)可以自由變動”是什么意思呢?這需要回到理論上去回答。在理論上,從20000人中隨機(jī)抽取200人冇C
6、囂0。種抽取方法,也就是說,在理論上研究者可以得到c芻oo個(gè)不同的、樣本容量均為200人的樣本,這個(gè)數(shù)據(jù)量是很大的(沒有必要確切知道它的值)。這樣,在理論上就存在很多組調(diào)查數(shù)據(jù)(雖然研究者確實(shí)只調(diào)查了一個(gè)200人的樣木,也只獲得了一組整據(jù)),每組都有200個(gè)數(shù)據(jù)。每組數(shù)據(jù)在理論上都冇對應(yīng)的統(tǒng)計(jì)量(如平均數(shù)疋),正是這些統(tǒng)計(jì)量的分布,構(gòu)成了統(tǒng)計(jì)學(xué)屮所說的抽樣分布,它是基礎(chǔ)統(tǒng)計(jì)學(xué)的核心內(nèi)容。所以,僅僅在理論上,這200個(gè)數(shù)據(jù)屮的199個(gè)數(shù)據(jù)是可以隨不同樣本而變化的、自由的。當(dāng)然,話說冋來,這種自由并非是絕對的,它們也只能在總體的取值范圍內(nèi)變動,例如,關(guān)于“收入”這個(gè)
7、變量的取值就不可能為負(fù)值。第四,“自由度”是誰的?從前面的分析中可以知道,“自由度”產(chǎn)生于這樣的背景下:運(yùn)用一組數(shù)據(jù)來求“統(tǒng)計(jì)量”。離開“一組數(shù)據(jù)”就不可能冇“統(tǒng)計(jì)量”,不計(jì)算“統(tǒng)計(jì)量”,“一組數(shù)據(jù)”就失去了科學(xué)的價(jià)值。所以,“自由度”應(yīng)該是“統(tǒng)計(jì)量”和“一組數(shù)據(jù)”所共同擁有的。當(dāng)然,為了方便,我們說“統(tǒng)計(jì)量的自由度”或者“一組數(shù)據(jù)的自由度”也都是可以接受的。二、如何計(jì)算“自由度”?自由度的大小與計(jì)算統(tǒng)計(jì)量時(shí)的確定條件的數(shù)目成反比,計(jì)算某個(gè)統(tǒng)計(jì)量的口由度,原則上是用數(shù)據(jù)的個(gè)數(shù)減去“確定”條件的個(gè)數(shù)。但說起來容易算起來難。常見的統(tǒng)計(jì)量有平均數(shù)〒、樣本標(biāo)準(zhǔn)差s、M直
8、、X2(卡方)值、F值等