資源描述:
《《SPSS回歸分析》PPT課件》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、回歸分析介紹:1、回歸分析的概念和模型2、回歸分析的過(guò)程回歸分析的概念尋求有關(guān)聯(lián)(相關(guān))的變量之間的關(guān)系主要內(nèi)容:從一組樣本數(shù)據(jù)出發(fā),確定這些變量間的定量關(guān)系式對(duì)這些關(guān)系式的可信度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn)從影響某一變量的諸多變量中,判斷哪些變量的影響顯著,哪些不顯著利用求得的關(guān)系式進(jìn)行預(yù)測(cè)和控制回歸分析的模型按是否線(xiàn)性分:線(xiàn)性回歸模型和非線(xiàn)性回歸模型按自變量個(gè)數(shù)分:簡(jiǎn)單的一元回歸,多元回歸基本的步驟:利用SPSS得到模型關(guān)系式,是否是我們所要的,要看回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))和回歸系數(shù)b的顯著性檢驗(yàn)(T檢驗(yàn)),還要看擬合程度R2(相關(guān)系數(shù)的平方,一元回歸用RSquare,多元回歸用A
2、djustedRSquare)回歸分析的過(guò)程在回歸過(guò)程中包括:Liner:線(xiàn)性回歸CurveEstimation:曲線(xiàn)估計(jì)BinaryLogistic:二分變量邏輯回歸MultinomialLogistic:多分變量邏輯回歸Ordinal序回歸Probit:概率單位回歸Nonlinear:非線(xiàn)性回歸WeightEstimation:加權(quán)估計(jì)2-StageLeastsquares:二段最小平方法OptimalScaling最優(yōu)編碼回歸我們只講前面3個(gè)簡(jiǎn)單的(一般教科書(shū)的講法)1線(xiàn)性回歸(Liner)一元線(xiàn)性回歸方程:y=a+bxa稱(chēng)為截距b為回歸直線(xiàn)的斜率用R2判定系數(shù)判定一個(gè)線(xiàn)性
3、回歸直線(xiàn)的擬合程度:用來(lái)說(shuō)明用自變量解釋因變量變異的程度(所占比例)多元線(xiàn)性回歸方程:y=b0+b1x1+b2x2+…+bnxnb0為常數(shù)項(xiàng)b1、b2、…、bn稱(chēng)為y對(duì)應(yīng)于x1、x2、…、xn的偏回歸系數(shù)用AdjustedR2調(diào)整判定系數(shù)判定一個(gè)多元線(xiàn)性回歸方程的擬合程度:用來(lái)說(shuō)明用自變量解釋因變量變異的程度(所占比例)一元線(xiàn)性回歸模型的確定:一般先做散點(diǎn)圖(Graphs->Scatter->Simple),以便進(jìn)行簡(jiǎn)單地觀(guān)測(cè)(如:Salary與Salbegin的關(guān)系)若散點(diǎn)圖的趨勢(shì)大概呈線(xiàn)性關(guān)系,可以建立線(xiàn)性方程,若不呈線(xiàn)性分布,可建立其它方程模型,并比較R2(-->1)來(lái)確定
4、一種最佳方程式(曲線(xiàn)估計(jì))多元線(xiàn)性回歸一般采用逐步回歸方法-Stepwise逐步回歸方法的基本思想對(duì)全部的自變量x1,x2,...,xp,按它們對(duì)Y貢獻(xiàn)的大小進(jìn)行比較,并通過(guò)F檢驗(yàn)法,選擇偏回歸平方和顯著的變量進(jìn)入回歸方程,每一步只引入一個(gè)變量,同時(shí)建立一個(gè)偏回歸方程。當(dāng)一個(gè)變量被引入后,對(duì)原已引入回歸方程的變量,逐個(gè)檢驗(yàn)他們的偏回歸平方和。如果由于引入新的變量而使得已進(jìn)入方程的變量變?yōu)椴伙@著時(shí),則及時(shí)從偏回歸方程中剔除。在引入了兩個(gè)自變量以后,便開(kāi)始考慮是否有需要剔除的變量。只有當(dāng)回歸方程中的所有自變量對(duì)Y都有顯著影響而不需要剔除時(shí),在考慮從未選入方程的自變量中,挑選對(duì)Y有顯著
5、影響的新的變量進(jìn)入方程。不論引入還是剔除一個(gè)變量都稱(chēng)為一步。不斷重復(fù)這一過(guò)程,直至無(wú)法剔除已引入的變量,也無(wú)法再引入新的自變量時(shí),逐步回歸過(guò)程結(jié)束。線(xiàn)性回歸分析實(shí)例實(shí)例:Data07-03建立一個(gè)以初始工資Salbegin、工作經(jīng)驗(yàn)prevexp、工作時(shí)間jobtime、工作種類(lèi)jobcat、受教育年限edcu等為自變量,當(dāng)前工資Salary為因變量的回歸模型。先做數(shù)據(jù)散點(diǎn)圖,觀(guān)測(cè)因變量Salary與自變量Salbegin之間關(guān)系是否有線(xiàn)性特點(diǎn)Graphs->Scatter->SimpleXAxis:SalbeginYAxis:Salary若散點(diǎn)圖的趨勢(shì)大概呈線(xiàn)性關(guān)系,可以建立線(xiàn)
6、性回歸模型Analyze->Regression->LinearDependent:SalaryIndependents:Salbegin,prevexp,jobtime,jobcat,edcu等變量Method:Stepwise比較有用的結(jié)果:擬合程度AdjustedR2:越接近1擬合程度越好回歸方程的顯著性檢驗(yàn)Sig回歸系數(shù)表Coefficients的Model最后一個(gè)中的回歸系數(shù)B和顯著性檢驗(yàn)Sig得模型:Salary=-15038.6+1.37Salbegin+5859.59jobcat-19.55prevexp+154.698jobtime+539.64edcu2曲線(xiàn)估
7、計(jì)(CurveEstimation)對(duì)于一元回歸,若散點(diǎn)圖的趨勢(shì)不呈線(xiàn)性分布,可以利用曲線(xiàn)估計(jì)方便地進(jìn)行線(xiàn)性擬合(liner)、二次擬合(Quadratic)、三次擬合(Cubic)等。采用哪種擬合方式主要取決于各種擬合模型對(duì)數(shù)據(jù)的充分描述(看修正AdjustedR2-->1)不同模型的表示模型名稱(chēng)回歸方程相應(yīng)的線(xiàn)性回歸方程Linear(線(xiàn)性)Y=b0+b1tQuadratic(二次)Y=b0+b1t+b2t2Compound(復(fù)合)Y=b0(b1t)Ln(Y)=ln(b0)+l