線性相關(guān)和回歸(一)

線性相關(guān)和回歸(一)

ID:33181395

大?。?50.00 KB

頁數(shù):14頁

時(shí)間:2019-02-21

線性相關(guān)和回歸(一)_第1頁
線性相關(guān)和回歸(一)_第2頁
線性相關(guān)和回歸(一)_第3頁
線性相關(guān)和回歸(一)_第4頁
線性相關(guān)和回歸(一)_第5頁
資源描述:

《線性相關(guān)和回歸(一)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蟻羅芄蚅薇羄莇蕆袆羄肆芀螂羃膈蒆蚈羂芁艿薄肁羀蒄蒀肀肅芇蝿聿膅蒂螅肈莇芅蟻肈肇薁薇肇腿莃裊肆節(jié)蕿螁肅莄莂蚇膄肄薇薃螁膆莀葿螀羋薅袈蝿肈蒈螄螈膀蚄蝕螇芃蕆薆螆蒞艿襖螆肄蒅螀裊膇羋蚆襖艿蒃薂袃罿芆薈袂膁薁袇袁芃莄螃袀莆薀蠆袀肅莃薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蟻羅芄蚅薇羄莇蕆袆羄肆芀螂羃膈蒆蚈羂芁艿薄肁羀蒄蒀肀肅芇蝿聿膅蒂螅肈莇芅蟻肈肇薁薇肇腿莃裊肆節(jié)蕿螁肅莄莂蚇膄肄薇薃螁膆莀葿螀羋薅袈蝿肈蒈螄螈膀蚄蝕螇芃蕆薆螆蒞艿襖螆肄蒅螀裊膇羋蚆襖艿蒃薂袃罿芆薈袂膁薁袇袁芃莄螃袀莆薀蠆袀肅莃薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蟻羅芄蚅薇羄莇蕆

2、袆羄肆芀螂羃膈蒆蚈羂芁艿薄肁羀蒄蒀肀肅芇蝿聿膅蒂螅肈莇芅蟻肈肇薁薇肇腿莃裊肆節(jié)蕿螁肅莄莂蚇膄肄薇薃螁膆莀葿螀羋薅袈蝿肈蒈螄螈膀蚄蝕螇芃蕆薆螆蒞艿襖螆肄蒅螀裊膇羋蚆襖艿蒃薂袃罿芆薈袂膁薁袇袁芃莄螃袀莆薀蠆袀肅莃薅衿膈薈蒁羈芀莁螀羇羀薆蚅羆肂荿蟻羅芄蚅薇羄莇蕆袆羄肆芀螂羃膈蒆蚈羂芁第九章線性回歸上一章討論的線性相關(guān)用于描述兩個(gè)隨機(jī)變量X與Y之間線性聯(lián)系的程度,結(jié)論所反映的是它們相互之間的關(guān)系,兩變量并無主次之分。隨著所探索問題的深入,研究者通常更感興趣于其中的一個(gè)變量如何定量地影響另一變量的取值,如醫(yī)學(xué)研究中常需要從某項(xiàng)指標(biāo)估算另一項(xiàng)指標(biāo),如果這指標(biāo)分別是測(cè)

3、量變量X和Y,我們希望由X推算Y的值。我們稱X為自變量,Y則稱為依賴于X的因變量。如果Y與X的關(guān)系呈線性時(shí),我們可以用線性回歸(linearregression)描述兩者的關(guān)系。一.回歸的概念:100多年前,有位英國遺傳學(xué)家(Galton)注意到當(dāng)父親身高很高時(shí),他的兒子的身高一般不會(huì)比父親身高更高。同樣如果父親很矮,他的兒子也一般不會(huì)比父親矮,而會(huì)向一般人的均值靠攏。當(dāng)時(shí)這位英國遺傳學(xué)家將這現(xiàn)象稱為回歸,現(xiàn)在將這概念引伸到隨機(jī)變量有向回歸線集中的趨勢(shì)。即觀察值不是全落在回歸線上,而是散布在回歸線周圍。但離回歸線越近,觀察值越多,偏離較遠(yuǎn)的觀察值極少,這

4、種不完全呈函數(shù)關(guān)系,但又有一定數(shù)量的關(guān)系的現(xiàn)象稱回歸。二.線性回歸的統(tǒng)計(jì)描述:(一)線性回歸的方程:=a+bX(二)線性回歸的參數(shù)估計(jì):線性方程:Y=a+bX回歸方程:=a+bX式中a,b是決定回歸直線的兩個(gè)系數(shù)。a為截距,b為回歸系數(shù),即直線的斜率。b的統(tǒng)計(jì)學(xué)意義是X每增加(減)一個(gè)單位,Y平均改變b個(gè)單位。怎樣的最好地代表了所有的Y,需要有個(gè)標(biāo)準(zhǔn)。經(jīng)典的標(biāo)準(zhǔn)是最小二乘(leastsquares)原則:每個(gè)觀察點(diǎn)距離回歸線的縱向距離的平方和最小。得:用例8.1,示范線性回歸的計(jì)算過程:=74.17+0.5698X三.回歸系數(shù)的統(tǒng)計(jì)推斷:(一)回歸系數(shù)的

5、假設(shè)檢驗(yàn)(t檢驗(yàn)):1.建立檢驗(yàn)假設(shè):H0:β=0,H1:β≠0,α=0.052.計(jì)算統(tǒng)計(jì)量t:υ=n-2先計(jì)算剩余標(biāo)準(zhǔn)差s:已知:b=0.5698s為剩余標(biāo)準(zhǔn)差:即去除X對(duì)Y的作用后,Y的變異。回歸系數(shù)的標(biāo)準(zhǔn)誤為:()3.確定概率和判斷結(jié)果:υ=n-2=20-2=18,P<0.01,拒絕H0,可認(rèn)為回歸系數(shù)有統(tǒng)計(jì)學(xué)意義。(二)回歸方程的假設(shè)檢驗(yàn)(方差分析,ANOVA):1.建立檢驗(yàn)假設(shè):H0:回歸無貢獻(xiàn)H1:回歸有貢獻(xiàn)α=0.052.計(jì)算統(tǒng)計(jì)量F:方差分析的基本思想:將總的變異分離成各個(gè)部分,確定各部分變異的來源,然后將處理因素的變異與隨機(jī)變異(誤差)

6、比較。如果比值接近1,說明都是隨機(jī)變異,如果比值遠(yuǎn)大于1,說明處理變異中除隨機(jī)變異外還有效應(yīng)變異存在。在Y的總變異(總離均差平方和)中,包含回歸離均差平方和和殘差離均差平方和。即:SST=SSr+SSe總SST是:回歸SSr是:殘差SSe是:698.55-603.63=94.92方差分析的統(tǒng)計(jì)量是F值:變異來源離均差平方和(SS)自由度(υ)均方(MS)F值回歸603.631603.63114.54殘差94.92185.27總698.55193.確定概率和判斷結(jié)果:查υ1=1和υ2=18的F界值(附表6.1),得F=4.41,P<0.05,可以認(rèn)為回歸有

7、貢獻(xiàn)。(★分子的自由度為1時(shí),)(三)確定系數(shù):相關(guān)系數(shù)的平方稱為確定系數(shù),它反映回歸貢獻(xiàn)的程度。相當(dāng)于在總離均差平方和中回歸能解釋的百分比。即說明回歸貢獻(xiàn)占Y的總變異中的比例。本例r=0.9296,R2=0.8641,即由父親的身高信息大約可解釋兒子身高變異性的86%。四.幾種置信區(qū)間估計(jì):1.β的置信區(qū)間:意義:估計(jì)X對(duì)Y的效應(yīng)有多大,如例9.1:回歸系數(shù)為0.5698,置信區(qū)間是(0.48,0.68),說明兒子身高起碼有一半是受父親影響的。2.的置信區(qū)間:意義:當(dāng)估計(jì)出Y的值(),根據(jù)置信區(qū)間可以知道誤差有多大。如例9.1:某父親身高165.8cm

8、,估計(jì)他兒子的身高是168.64cm,置信區(qū)間是167.51~169.77cm,

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。