資源描述:
《逐步回歸分析案例》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、逐步回歸分析案例:逐步回歸分析在自變量很多時(shí),其中有的因素可能對(duì)應(yīng)變量的影響不是很大,而且x之間可能不完全相互獨(dú)立的,可能有種種互作關(guān)系。在這種情況下可用逐步回歸分析,進(jìn)行x因子的篩選,這樣建立的多元回歸模型預(yù)測(cè)效果會(huì)更較好。逐步回歸分析,首先要建立因變量y與自變量x之間的總回歸方程,再對(duì)總的方程及每—個(gè)自變量進(jìn)行假設(shè)檢驗(yàn)。當(dāng)總的方程不顯著時(shí),表明該多元回歸方程線性關(guān)系不成立;而當(dāng)某—個(gè)自變量對(duì)y影響不顯著時(shí),應(yīng)該把它剔除,重新建立不包含該因子的多元回歸方程。篩選出有顯著影響的因子作為自變量,并建
2、立“最優(yōu)”回歸方程?;貧w方程包含的自變量越多,回歸平方和越大,剩余的平方和越小,剩余均方也隨之較小,預(yù)測(cè)值的誤差也愈小,模擬的效果愈好。但是方程中的變量過多,預(yù)報(bào)工作量就會(huì)越大,其中有些相關(guān)性不顯著的預(yù)報(bào)因子會(huì)影響預(yù)測(cè)的效果。因此在多元回歸模型中,選擇適宜的變量數(shù)目尤為重要。逐步回歸在病蟲預(yù)報(bào)中的應(yīng)用實(shí)例:以陜西省某地區(qū)1984~1995年的煙蚜傳毒病情資料、相關(guān)蟲情和氣象資料為例(數(shù)據(jù)見DATA6.xls),建立蚜傳病毒病情指數(shù)的逐步回歸模型,說(shuō)明逐步回歸分析的具體步驟。影響蚜傳病毒病情指數(shù)的蟲
3、情因子和氣象因子一共有21個(gè),通過逐步回歸,從中選出對(duì)病情指數(shù)影響顯著的因子,從而建立相應(yīng)的模型。對(duì)1984~1995年的病情指數(shù)進(jìn)行回檢,然后對(duì)1996~1998年的病情進(jìn)行預(yù)報(bào),再檢驗(yàn)預(yù)報(bào)的效果。變量說(shuō)明如下:y:歷年病情指數(shù)x1:前年冬季油菜越冬時(shí)的蚜量(頭/株)x2:前年冬季極端氣溫x3:5月份最高氣溫x4:5月份最低氣溫x5:3~5月份降水量x6:4~6月份降水量x7:3~5月份均溫x8:4~6月份均溫x9:4月份降水量x10:4月份均溫x11:5月份均溫x12:5月份降水量x13:6月
4、份均溫x14:6月份降水量x15:第一次蚜遷高峰期百株煙草有翅蚜量x16:5月份油菜百株蚜量x17:7月份降水量x18:8月份降水量x19:7月份均溫x20:8月份均溫x21:元月均溫1)準(zhǔn)備分析數(shù)據(jù)在SPSS數(shù)據(jù)編輯窗口中,用“File→Open→Data”命令,打開“DATA6.xls”數(shù)據(jù)文件。數(shù)據(jù)工作區(qū)如下圖3-1顯示。圖3-12)啟動(dòng)線性回歸過程單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項(xiàng),將打開如圖3-2所示的線性回歸過程窗口。圖3-2線性回歸
5、對(duì)話窗口3)設(shè)置分析變量設(shè)置因變量:將左邊變量列表中的“y”變量,選入到“Dependent”因變量顯示欄里。設(shè)置自變量:將左邊變量列表中的“x1”~“x21”變量,全部選移到“Independent(S)”自變量欄里。????設(shè)置控制變量:本例子中不使用控制變量,所以不選擇任何變量。選擇標(biāo)簽變量:選擇“年份”為標(biāo)簽變量。選擇加權(quán)變量:本例子沒有加權(quán)變量,因此不作任何設(shè)置。4)回歸方式在“Method”分析方法框中選中“Stepwise”逐步分析方法。該方法是根據(jù)“Options”選擇對(duì)話框中顯著
6、性檢驗(yàn)(F)的設(shè)置,在方程中進(jìn)入或剔除單個(gè)變量,直到所建立的方程中不再含有可加入或可剔除的變量為止。設(shè)置后的對(duì)話窗口如圖3-3。圖3-35)設(shè)置變量檢驗(yàn)水平在圖6-15主對(duì)話框里單擊“Options”按鈕,將打開如圖3-4所示的對(duì)話框。圖3-4“SteppingMethodCriteria”框里的設(shè)置用于逐步回歸分析的選擇標(biāo)準(zhǔn)。其中“UseprobabilityofF”選項(xiàng),提供設(shè)置顯著性F檢驗(yàn)的概率。如果一個(gè)變量的F檢驗(yàn)概率小于或等于進(jìn)入“Entry”欄里設(shè)置的值,那么這個(gè)變量將被選入回歸方程中
7、;當(dāng)回歸方程中變量的F值檢驗(yàn)概率大于剔除“Removal”欄里設(shè)置的值,則該變量將從回歸方程中被剔除。由此可見,設(shè)置F檢驗(yàn)概率時(shí),應(yīng)使進(jìn)入值小于剔除值?!癠esFvalue”選項(xiàng),提供設(shè)置顯著性F檢驗(yàn)的分布值。如果一個(gè)變量的F值大于所設(shè)置的進(jìn)入值(Entry),那么這個(gè)變量將被選入回歸方程中;當(dāng)回歸方程中變量的F值小于設(shè)置的剔除值(Removal),則該變量將從回歸方程中被剔除。同時(shí),設(shè)置F分布值時(shí),應(yīng)該使進(jìn)入值大于剔除值。本例子使用顯著性F檢驗(yàn)的概率,在進(jìn)入“Entry”欄里設(shè)置為“0.15”,
8、在剔除“Removal”欄里設(shè)置為“0.20”(剔除的概率值應(yīng)比進(jìn)入的值大),如圖6-17所示。圖6-17窗口中的其它設(shè)置參照一元回歸設(shè)置。6)設(shè)置輸出統(tǒng)計(jì)量在主對(duì)話圖3-2窗口中,單擊“Statistics”按鈕,將打開如圖6-18所示的對(duì)話框。該對(duì)話框用于設(shè)置相關(guān)參數(shù)。其中各項(xiàng)的意義分別為:圖3-5“Statistics”對(duì)話框①“RegressionCoefficients”回歸系數(shù)選項(xiàng):“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計(jì)量。????“Confidenceinter