資源描述:
《《SPSS做回歸分析》PPT課件》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、3.4用SPSS作回歸分析一、簡介在現(xiàn)實(shí)生活中,客觀事物常受多種因素影響,我們記錄下相應(yīng)數(shù)據(jù)并加以分析,目的是為了找出對(duì)我們所關(guān)心的指標(biāo)(因變量)Y有影響的因素(也稱自變量或回歸變量)x1、x2、…、xm,并建立用x1、x2、…、xm預(yù)報(bào)Y的經(jīng)驗(yàn)公式:從而用以進(jìn)行預(yù)測(cè)或控制,達(dá)到指導(dǎo)生產(chǎn)活動(dòng)的目的。多元線性回歸以年齡為自變量x,血壓為因變量y,可作出如下散點(diǎn)圖:年齡394745476545674267563650392144血壓144120138145162142170124158154136142120120116年齡645659344248451
2、720195363292569血壓162150140110128130135114116124158144130125175例1、某醫(yī)學(xué)研究所對(duì)30個(gè)不同年齡的人的血壓(高壓)進(jìn)行了測(cè)量,得到如下數(shù)據(jù):為了判斷經(jīng)驗(yàn)公式是否可用線性函數(shù)來擬合,可以畫出散點(diǎn)圖觀察。其方法如下:雙擊改變顯示格式改變坐標(biāo)軸的顯示為了求得經(jīng)驗(yàn)公式,可通過如下步驟進(jìn)行:從散點(diǎn)圖可以看出年齡與血壓有線性關(guān)系:當(dāng)自變量和因變量選好后,點(diǎn)擊OK鍵Model為回歸方程模型編號(hào)(不同方法對(duì)應(yīng)不同模型)R為回歸方程的復(fù)相關(guān)系數(shù)RSquare即R2系數(shù),用以判斷自變量對(duì)因變量的影響有多大,但
3、這并不意味著越大越好——自變量增多時(shí),R2系數(shù)會(huì)增大,但模型的擬合度未必更好AdjustedRSquare即修正R2,為了盡可能確切地反映模型的擬合度,用該參數(shù)修正R2系數(shù)偏差,它未必隨變量個(gè)數(shù)的增加而增加Std.ErroroftheEstimate是估計(jì)的標(biāo)準(zhǔn)誤差結(jié)果說明——常用統(tǒng)計(jì)量:SumofSquares為回歸平方和(Regression)、殘差平方和(Residual)、總平方和(Total)df為自由度MeanSquareFSig為大于F的概率,其值為0.000,拒絕回歸系數(shù)為0的原假設(shè):b0=b1=0——即認(rèn)為回歸方程顯著性成立結(jié)果說明
4、——方差分析:Model為回歸方程模型編號(hào)UnstandardizedCoefficients為非標(biāo)準(zhǔn)化系數(shù),B為系數(shù)值,Std.Error為系數(shù)的標(biāo)準(zhǔn)差StandardizedCoefficients為標(biāo)準(zhǔn)化系數(shù)t為t檢驗(yàn),是偏回歸系數(shù)為0(和常數(shù)項(xiàng)為0)的假設(shè)檢驗(yàn)Sig.為偏回歸系數(shù)為0(和常數(shù)項(xiàng)為0)的假設(shè)檢驗(yàn)的顯著性水平值B為Beta系數(shù),Std.Error為相應(yīng)的標(biāo)準(zhǔn)差結(jié)果說明——回歸系數(shù)分析:第一導(dǎo)絲盤速度Y是合成纖維抽絲的重要因素,它與電流的周波X有密切關(guān)系,由生產(chǎn)記錄得:周波X49.250.049.349.049.049.549.84
5、9.950.250.2速度Y16.717.016.816.616.716.816.917.017.017.1試求Y對(duì)X的經(jīng)驗(yàn)回歸直線方程,并求誤差方差σ2的無偏估計(jì)值。檢驗(yàn)X與Y之間是否存在顯著的線性關(guān)系(取α=0.01)?例.《概率論與數(shù)理統(tǒng)計(jì)》P267例9.2.1檢驗(yàn)說明線性關(guān)系顯著操作步驟:Analyze→Regression→Linear…→Statistics→ModelfitDescriptives結(jié)果:對(duì)于多元線性回歸主要需研究如下幾個(gè)問題:建立因變量Y與x1、x2、…、xm的經(jīng)驗(yàn)公式(回歸方程)對(duì)經(jīng)驗(yàn)公式的可信度進(jìn)行檢驗(yàn)判斷每個(gè)自變量
6、xi(i=1,…,m)對(duì)Y的影響是否顯著?利用經(jīng)驗(yàn)公式進(jìn)行預(yù)報(bào)、控制及指導(dǎo)生產(chǎn)診斷經(jīng)驗(yàn)公式是否適合這組數(shù)據(jù)方差分析的主要思想是把yi的總方差進(jìn)行分解:模型平方和誤差平方和二、多元線性回歸參數(shù)估計(jì)方法——最小二乘法回歸方程顯著性的檢驗(yàn)——就是檢驗(yàn)以下假設(shè)是否成立(采用方差分析法):如果自變量對(duì)Y的影響顯著,則總方差主要應(yīng)由xi引起,也就是原假設(shè)不成立,從而檢驗(yàn)統(tǒng)計(jì)量為:方差來源自由度平方和均方Fp值自變量mMSSMMSMMS——EMSp隨機(jī)誤差n-m-1ESSEMS和n-1TSS多元線性回歸的方差分析表:在實(shí)際問題中,影響因變量Y的因素(自變量)可能很
7、多。在回歸方程中,如果漏掉了重要因素,則會(huì)產(chǎn)生大的偏差;但如果回歸式中包含的因素太多,則不僅使用不便,且可能影響預(yù)測(cè)精度。如何選擇適當(dāng)?shù)淖兞?,建立最?yōu)的回歸方程呢?在最優(yōu)的方程中,所有變量對(duì)因變量Y的影響都應(yīng)該是顯著的,而所有對(duì)Y影響不顯著的變量都不包含在方程中。選擇方法主要有:逐步篩選法(STEPWISE)(最常用)向前引入法(FORWARD)向后剔除法(BACKWARD)等逐步回歸——變量選擇問題開始對(duì)不在方程中的變量考慮能否引入?引入變量能對(duì)已在方程中的變量考慮能否剔除?能剔除變量否篩選結(jié)束否逐步回歸的基本思想和步驟:某地區(qū)大春糧食產(chǎn)量y和大春
8、糧食播種面積x1、化肥用量x2、肥豬發(fā)展頭數(shù)x3、水稻抽穗揚(yáng)花期降雨量x4的數(shù)據(jù)如下表,尋求大春糧食產(chǎn)量的預(yù)