資源描述:
《回歸、logstic模型地預(yù)測(cè)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、實(shí)用標(biāo)準(zhǔn)文案2013年數(shù)學(xué)建模第二次實(shí)戰(zhàn)訓(xùn)練論文題目線性回歸模型的預(yù)測(cè)隊(duì)員姓名系別專業(yè)1小團(tuán)數(shù)學(xué)系數(shù)學(xué)與應(yīng)用數(shù)學(xué)2陳佩數(shù)學(xué)系數(shù)學(xué)與應(yīng)用數(shù)學(xué)3鄒靈弟數(shù)學(xué)系數(shù)學(xué)與應(yīng)用數(shù)學(xué)2013年8月21日精彩文檔實(shí)用標(biāo)準(zhǔn)文案摘要本文主要是根據(jù)所給的回歸數(shù)據(jù),利用軟件建立線性回歸模型,并根據(jù)所建立的數(shù)學(xué)模型來解決相應(yīng)的實(shí)際問題。首先,根據(jù)杠桿原理,確定強(qiáng)影響點(diǎn),其次,對(duì)所給的數(shù)據(jù)利用單樣本K-S檢驗(yàn)進(jìn)行正態(tài)性檢驗(yàn),得出數(shù)據(jù)是符合正態(tài)分布的,并對(duì)回歸數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn),得出y對(duì)自變量有顯著的線性關(guān)系。再次,利用條件數(shù)原理進(jìn)行自變量的多重共線性檢測(cè),消除后得到模型。最
2、后,利用殘差的自相關(guān)性來進(jìn)行模型的檢驗(yàn),并作出相應(yīng)的預(yù)測(cè)。一、問題重述本文所給的回歸數(shù)據(jù)如下表行YX1X2X3X4X5X6144349797681520522902770316612936761159213009339453692629258247548167429416320262963154341411119精彩文檔實(shí)用標(biāo)準(zhǔn)文案74531056047510212861711485841720285951498727112-124210400155999151117411473626281912071215725117994513440456
3、58419131951448092756392023215136272682417134165301115293111325617610781028457266186171068782187276196009798711282662048067656213121962127938264410811022446563299168188234505410050111520524335535560801702545961537965193266306010810417827327483837871118233286177412566164265296
4、05891217188283303886430811010176313513444657914332366713456891623349388308713020734648112105123512343544957697254200363406135551301523729229454713131233868882105812092683940880556111119740461828854147225本文需要解決的六個(gè)問題是:1.檢測(cè)強(qiáng)影響點(diǎn),并求出杠桿值;2.正態(tài)性檢驗(yàn);3.相關(guān)性檢驗(yàn);4.自變量的多重共線性檢測(cè),若有多重共線性,試消除,再
5、建模;5.殘差的自相關(guān)分析,模型的合理性分析。6.預(yù)測(cè)時(shí)的預(yù)測(cè)值。精彩文檔實(shí)用標(biāo)準(zhǔn)文案一.模型假設(shè)1.假設(shè)所給的數(shù)據(jù)真實(shí)、可靠;2.假設(shè)未來的數(shù)據(jù)沒有太大的變動(dòng);3.假設(shè)所給數(shù)據(jù)都是隨機(jī)的的變量。二.符號(hào)說明y的預(yù)測(cè)值;第ij個(gè)數(shù)據(jù)的庫克距離;第ij個(gè)數(shù)據(jù)的杠桿值;Sig相伴概率;三.問題分析該問題主要是處理回歸數(shù)據(jù)的問題,從而想到建立多元線性回歸模型,由于是回歸模型,所以我們選用SPSS軟件來建立模型,但在建立模型之前必須做相關(guān)性的檢驗(yàn),檢驗(yàn)都通過后,才能建立模型,并作出相應(yīng)的預(yù)測(cè)。五.模型建立與求解5.1問題一模型建立與求解5.1.1問題一
6、的分析由殘差向量的方差陣公式:可知,因?yàn)楦軛U值大的觀測(cè)點(diǎn)遠(yuǎn)離樣本中心,較大的杠桿值的殘差偏小,所以它能夠把回歸方程拉向自身,我們把杠桿值大的樣本點(diǎn)稱為強(qiáng)影響點(diǎn)。由于強(qiáng)影響點(diǎn)并不總是因變量的異常值點(diǎn),因而不能單純根據(jù)杠桿值的大小判斷強(qiáng)影響點(diǎn)是否異常。為此,我們引入庫克距離來判斷強(qiáng)影響點(diǎn)是否為因變量的異常值點(diǎn)。庫克距離的計(jì)算公式為:庫克距離反映了杠桿值與殘差大小的一個(gè)綜合效應(yīng)。根據(jù)帽子矩陣的跡的公式:精彩文檔實(shí)用標(biāo)準(zhǔn)文案則杠桿值的平均值為:這樣,杠桿值如果大于2倍或3倍的,我們就認(rèn)為這個(gè)杠桿值是大的。對(duì)于庫克距離大小標(biāo)準(zhǔn)的判定比較復(fù)雜,較精確的方法
7、請(qǐng)見參考文獻(xiàn)。我們提供一個(gè)粗略的標(biāo)準(zhǔn)是:當(dāng)時(shí),認(rèn)為該強(qiáng)影響點(diǎn)不是異常值點(diǎn);當(dāng)時(shí),認(rèn)為該強(qiáng)影響點(diǎn)是異常值點(diǎn)。在用軟件計(jì)算杠桿值時(shí),計(jì)算的是中心化杠桿值,由參考文獻(xiàn)可知因此,,中心化杠桿值的平均值是5.1.2問題一模型的建立對(duì)所給的數(shù)據(jù)進(jìn)行處理,利用SPSS軟件計(jì)算出庫克距離(cook)和杠桿值得到表一所示。表1:行yx1x2x3x4x5x6殘差刪除殘差學(xué)生殘差刪除學(xué)生殘差Cook距離杠桿值14434979768152058.8710.00930.244510.25610.001240.0893229027703166129-5.9-7.4063-
8、0.16375-0.180190.001180.1733367611592130093392.674.376020.073780.092930.000