資源描述:
《第7講-統(tǒng)計(jì)回歸模型.ppt》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第7講統(tǒng)計(jì)回歸模型軟件開發(fā)人員的薪金農(nóng)作物施肥效果分析統(tǒng)計(jì)模型如果由于客觀事物內(nèi)部規(guī)律的復(fù)雜性及人們認(rèn)識(shí)程度的限制,無法分析實(shí)際對(duì)象內(nèi)在的因果關(guān)系,建立合乎機(jī)理規(guī)律的模型,那么通常要搜集大量的數(shù)據(jù),基于對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析建立模型,這就是本章還要討論的用途非常廣泛的一類隨機(jī)模型—統(tǒng)計(jì)回歸模型。案例1軟件開發(fā)人員的薪金【問題】一家高技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度等因素之間的關(guān)系,要建立一個(gè)數(shù)學(xué)模型,以便分析公司人士策略的合理性,并作為新聘用人員工資的參考。他們認(rèn)為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于是調(diào)查了46名開發(fā)人員的檔
2、案資料,如表。其中資歷一列指從事專業(yè)工作的年數(shù),管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學(xué)程度,2表示大學(xué)程度,3表示更高程度(研究生).編號(hào)薪金資歷管理教育編號(hào)薪金資歷管理教育0113876111171284440202116081031813245502031870111319136775030411283102201596551105117671032112366601062087221222213526130711772202231383960208105352012422884612091219520325169787111012313302261
3、4803802111497531127174048111221371312282218481313198003132913548801141141740130144671001152026341331159421002161323140332231741013編號(hào)薪金資歷管理教育332378010123425410111235148611101361688212023724170121338159901301392633013124017949140241256851513422783716124318838160244174831601451920717024619346200
4、1開發(fā)人員的薪金與其資歷、管理責(zé)任、教育程度分析與假設(shè)按照常識(shí),薪金自然按照資歷(年)的增長(zhǎng)而增加,管理人員的薪金高于非管理人員,教育程度越高薪金越高。薪金記作,資歷(年)記作為了表示是否為管理人員,作如下定義:1,管理人員0,非管理人員為了表示三種教育程度,定義1,中學(xué)0,其它1,大學(xué)0,其它這樣,中學(xué)用表示,大學(xué)用表示,研究生則用表示。(1)為了簡(jiǎn)單起見,我們假定資歷(年)對(duì)薪金的作用是線性的,即資歷每加一年,薪金的增長(zhǎng)是常數(shù);建立薪金與資歷,管理責(zé)任,教育程度之間的多元線性回歸模型:其中,是待估計(jì)的回歸系數(shù),是隨機(jī)誤差。利用MATLAB的系統(tǒng)工具箱可以得到回歸系數(shù)及其置信區(qū)
5、間(置信水平)、檢驗(yàn)統(tǒng)計(jì)量的結(jié)果,見表。(2)管理責(zé)任、教育程度、資歷諸因素之間沒有交互作用,建立線性回歸模型。模型的進(jìn)一步假設(shè):模型建立與求解1.基本模型參數(shù)參數(shù)估計(jì)值置信區(qū)間11032[1025811807]546[484608]6883[62487517]-2994[-3826-2162]148[-636931]結(jié)果分析:從表中,,即因變量(薪金)的95.7%可由模型確定,值超過檢驗(yàn)的臨界值,遠(yuǎn)小于,因而模型從整體來看時(shí)可用的。比如,利用模型可以估計(jì)(或估計(jì))一個(gè)大學(xué)畢業(yè)、有2年資歷、管理人員的薪金為:模型中各個(gè)回歸系數(shù)的含義可初步解釋如下:的系數(shù)為546,說明資歷每增加一
6、年,薪金增長(zhǎng)546;的系數(shù)為6883,說明管理人員的薪金比非管理人員多6883;的系數(shù)為-2994,說明中學(xué)程度的薪金比研究生少2994;【注意】上述解釋是就平均值來說的,并且,一個(gè)因素改變引起的因變量的變化量,都是在其它因素不變的條件下才成立的。的系數(shù)為148,說明大學(xué)程度的薪金比研究生多148,但是應(yīng)該的置信區(qū)間包含零點(diǎn),所以這個(gè)系數(shù)的解釋是不可靠的。注意到進(jìn)一步討論:的置信區(qū)間包含零點(diǎn),說明上述基本模型存在缺點(diǎn)。為了尋找改進(jìn)的方向,常用殘差分析法(殘差指薪金的實(shí)際值與模型估計(jì)的薪金我們將影響因素分成資歷—教育組合、與管理—教育組兩類。管理--教育組合定義如表:組合12345
7、6管理010101教育112233管理—教育組合之差,是基本模型中隨機(jī)誤差的估計(jì)值,這里用同一個(gè)符號(hào))。為了對(duì)殘差進(jìn)行分析,下圖給出與資歷的關(guān)系,及與管理--教育組合間的關(guān)系。與資歷的關(guān)系與組合的關(guān)系從左圖看,殘差大概分成3個(gè)水平,這是由于6種管理—教育組合混在一起,在模型中未被正確反映的結(jié)果;在模型中,管理責(zé)任和教育程度是分別起作用的,事實(shí)上,二者可能起著交互作用,如大學(xué)程度的管理人員的薪金會(huì)比二者分別的薪金之和高一點(diǎn)。從右圖看,對(duì)于前4個(gè)管理—教育組合,殘差或者全為正,或者全