資源描述:
《《SPSS回歸分析》課件》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第10章回歸分析介紹:1、回歸分析的概念和模型2、回歸分析的過程回歸分析的概念尋求有關(guān)聯(lián)(相關(guān))的變量之間的關(guān)系主要內(nèi)容:從一組樣本數(shù)據(jù)出發(fā),確定這些變量間的定量關(guān)系式對這些關(guān)系式的可信度進行各種統(tǒng)計檢驗從影響某一變量的諸多變量中,判斷哪些變量的影響顯著,哪些不顯著利用求得的關(guān)系式進行預(yù)測和控制回歸分析的模型按是否線性分:線性回歸模型和非線性回歸模型按自變量個數(shù)分:簡單的一元回歸,多元回歸基本的步驟:利用SPSS得到模型關(guān)系式,是否是我們所要的,要看回歸方程的顯著性檢驗(F檢驗)和回歸系數(shù)b的顯著性檢驗(T檢驗)
2、,還要看擬合程度R2(相關(guān)系數(shù)的平方,一元回歸用RSquare,多元回歸用AdjustedRSquare)回歸分析的過程在回歸過程中包括:Liner:線性回歸CurveEstimation:曲線估計BinaryLogistic:二分變量邏輯回歸MultinomialLogistic:多分變量邏輯回歸Ordinal序回歸Probit:概率單位回歸Nonlinear:非線性回歸WeightEstimation:加權(quán)估計2-StageLeastsquares:二段最小平方法OptimalScaling最優(yōu)編碼回歸我們只
3、講前面3個簡單的(一般教科書的講法)10.1線性回歸(Liner)一元線性回歸方程:y=a+bxa稱為截距b為回歸直線的斜率用R2判定系數(shù)判定一個線性回歸直線的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例)多元線性回歸方程:y=b0+b1x1+b2x2+…+bnxnb0為常數(shù)項b1、b2、…、bn稱為y對應(yīng)于x1、x2、…、xn的偏回歸系數(shù)用AdjustedR2調(diào)整判定系數(shù)判定一個多元線性回歸方程的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例)一元線性回歸模型的確定:一般先做散點圖(Gra
4、phs->Scatter->Simple),以便進行簡單地觀測(如:Salary與Salbegin的關(guān)系)若散點圖的趨勢大概呈線性關(guān)系,可以建立線性方程,若不呈線性分布,可建立其它方程模型,并比較R2(-->1)來確定一種最佳方程式(曲線估計)多元線性回歸一般采用逐步回歸方法-Stepwise逐步回歸方法的基本思想對全部的自變量x1,x2,...,xp,按它們對Y貢獻的大小進行比較,并通過F檢驗法,選擇偏回歸平方和顯著的變量進入回歸方程,每一步只引入一個變量,同時建立一個偏回歸方程。當一個變量被引入后,對原已引入
5、回歸方程的變量,逐個檢驗他們的偏回歸平方和。如果由于引入新的變量而使得已進入方程的變量變?yōu)椴伙@著時,則及時從偏回歸方程中剔除。在引入了兩個自變量以后,便開始考慮是否有需要剔除的變量。只有當回歸方程中的所有自變量對Y都有顯著影響而不需要剔除時,在考慮從未選入方程的自變量中,挑選對Y有顯著影響的新的變量進入方程。不論引入還是剔除一個變量都稱為一步。不斷重復(fù)這一過程,直至無法剔除已引入的變量,也無法再引入新的自變量時,逐步回歸過程結(jié)束。10.1.6線性回歸分析實例p240實例:P240Data07-03建立一個以初始工
6、資Salbegin、工作經(jīng)驗prevexp、工作時間jobtime、工作種類jobcat、受教育年限edcu等為自變量,當前工資Salary為因變量的回歸模型。先做數(shù)據(jù)散點圖,觀測因變量Salary與自變量Salbegin之間關(guān)系是否有線性特點Graphs->Scatter->SimpleXAxis:SalbeginYAxis:Salary若散點圖的趨勢大概呈線性關(guān)系,可以建立線性回歸模型Analyze->Regression->LinearDependent:SalaryIndependents:Salbegi
7、n,prevexp,jobtime,jobcat,edcu等變量Method:Stepwise比較有用的結(jié)果:擬合程度AdjustedR2:越接近1擬合程度越好回歸方程的顯著性檢驗Sig回歸系數(shù)表Coefficients的Model最后一個中的回歸系數(shù)B和顯著性檢驗Sig得模型:Salary=-15038.6+1.37Salbegin+5859.59jobcat-19.55prevexp+154.698jobtime+539.64edcu10.2曲線估計(CurveEstimation)對于一元回歸,若散點圖的趨
8、勢不呈線性分布,可以利用曲線估計方便地進行線性擬合(liner)、二次擬合(Quadratic)、三次擬合(Cubic)等。采用哪種擬合方式主要取決于各種擬合模型對數(shù)據(jù)的充分描述(看修正AdjustedR2-->1)不同模型的表示模型名稱回歸方程相應(yīng)的線性回歸方程Linear(線性)Y=b0+b1tQuadratic(二次)Y=b0+b1t+b2t2Compound(復(fù)合