線性回歸模型 畢業(yè)論文

線性回歸模型 畢業(yè)論文

ID:345147

大?。?80.00 KB

頁(yè)數(shù):15頁(yè)

時(shí)間:2017-07-26

線性回歸模型  畢業(yè)論文_第1頁(yè)
線性回歸模型  畢業(yè)論文_第2頁(yè)
線性回歸模型  畢業(yè)論文_第3頁(yè)
線性回歸模型  畢業(yè)論文_第4頁(yè)
線性回歸模型  畢業(yè)論文_第5頁(yè)
資源描述:

《線性回歸模型 畢業(yè)論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、線性回歸模型摘要:建立線性回歸模型是建立Y與X的適當(dāng)?shù)木€性回歸關(guān)系,通過(guò)及最小二乘估計(jì)和有關(guān)的統(tǒng)計(jì)推斷可以預(yù)測(cè)未來(lái)的數(shù)據(jù)。關(guān)鍵詞:多元線性回歸模型,多元線性回歸模型的矩陣表示,及的最小二乘估計(jì),統(tǒng)計(jì)推斷。15線性回歸模型1、線性回歸模型及其矩陣表示設(shè)Y是一個(gè)可觀測(cè)的隨機(jī)變量,它受到p-1個(gè)非隨機(jī)因素和隨機(jī)因素的影響。若Y與有如下線性關(guān)系:稱此模型為線性回歸模型,其中是未知參數(shù)(回歸系數(shù));是應(yīng)變量或響應(yīng)變量;稱自變量或回歸變量;稱為隨機(jī)誤差項(xiàng)并假定是不可觀測(cè)的隨機(jī)變量,而Y與是可觀測(cè)的變量。要建立多元線性回歸模型,首先要估計(jì)未知參數(shù)進(jìn)行n(n>p)次獨(dú)立觀測(cè),得到n

2、組數(shù)據(jù)(樣本)其中相互獨(dú)立且均服從分布。令其中Y稱為觀測(cè)向量,X稱為設(shè)計(jì)矩陣。并假定X為列滿秩的,即,是對(duì)估計(jì)的未知參數(shù)商量,是不可觀測(cè)的隨機(jī)誤差商量。是多元線性回歸模型的矩陣形式。152、參數(shù)估計(jì)2.1的最小二乘估計(jì)如果Y與滿足線性回歸模型側(cè)誤差應(yīng)是比較小的,因此,選擇使誤差項(xiàng)的平方和達(dá)到最小,其中,為此,將分別對(duì)求偏導(dǎo)并令其等于零,得K=0,1,…,P-1即K=0,1,…,P-1矩陣形式是稱此方程為正規(guī)方程。因?yàn)楣蚀嬖?,解正?guī)方程即得的最小二乘估計(jì)為2.2誤差方差的估計(jì)將自變量的名組觀測(cè)值代入回歸方程,可得因變量的各估計(jì)值(稱為擬合值)為稱15為殘差向量,其中為

3、n階對(duì)稱冪等矩陣,I為n階單位矩陣,稱數(shù)為殘差平方和(SSE)注意到且,故因此可得其中表示矩陣的跡,從而為的無(wú)偏估計(jì)。3、有關(guān)的統(tǒng)計(jì)推斷3.1回歸關(guān)系的統(tǒng)計(jì)推斷給定因變量Y與自變量的n組觀測(cè)值,利用前述方法可得到未知參數(shù)和的估計(jì),從而可給出Y與之間的線性回歸方程,但所求得的回歸方程是否有意義,也就是說(shuō)Y與之間是否存在顯著的線性關(guān)系,還需要對(duì)回歸方程進(jìn)行檢驗(yàn)。3.1.1建立方差分析表我們知道觀測(cè)值之所以有差異是由下述兩個(gè)原因引起的,一是當(dāng)Y與之間確定有線性關(guān)系時(shí),由于取值的不同,而引起值的變化;另一方面是除去Y與15的線性關(guān)系以外的因素,如對(duì)的非線性影響及隨機(jī)因素的影

4、響等,記則數(shù)據(jù)的總的離差平方和反應(yīng)了數(shù)據(jù)波動(dòng)性的大小殘差平方和反應(yīng)了數(shù)據(jù)除去Y與之間的線性關(guān)系以外的因素引起的數(shù)據(jù)的波動(dòng)。如果回歸平方和反應(yīng)了線性擬合值與它們的平均值的總偏差即由變量的變化所引起的的波動(dòng)。若SSE,SST和SSR有如下形式的矩陣表示15J表示一個(gè)元素全為1的n階方陣。自由度:自由度是指平方和中獨(dú)立變化項(xiàng)的數(shù)目。由于有一個(gè)關(guān)系式即彼此不是獨(dú)立變化的,故SST的自由度是n-1,SSE的自由度為n-p,SSR的自由度為p-1,它們的自由度關(guān)系是:n-1=(n-p)+(p-1)方差分析表方差來(lái)源平方和(SS)自由度(F)均方(MS)回歸p-1誤差n-p總和n

5、-1利用方差分析表,可對(duì)回歸方程的顯著性做檢驗(yàn)。3.1.2線性回歸關(guān)系的顯著性檢驗(yàn)為檢驗(yàn)Y與之間是否存在顯著的線性回歸關(guān)系,即檢驗(yàn)。假設(shè)15給定顯著性水平查分布表得臨值,計(jì)算F的觀測(cè)值。若:3.2回歸參數(shù)的統(tǒng)計(jì)推斷回歸關(guān)系中不一定每個(gè)自變量X對(duì)Y的影響都顯著的。因此,我們對(duì)自變量對(duì)的顯著性關(guān)系進(jìn)行檢驗(yàn)。檢驗(yàn)假的最小二乘估計(jì)為則而所以由于為的無(wú)偏估計(jì),從而自然地以作為的估計(jì)。所以的估計(jì)其中為的全對(duì)角線上的第k個(gè)元素的平方根,t(n-p)為自由度為n-p的分布15若:為真不真有偏大的趨勢(shì)4、實(shí)例摸公司在各地區(qū)銷售一種特殊的化妝品,該公司觀測(cè)了15個(gè)城市在某個(gè)月內(nèi)對(duì)該化妝

6、品的銷售量Y及各地區(qū)適合使用該化妝品的人數(shù)和人均收入的數(shù)據(jù)如下。化妝品銷售的調(diào)查數(shù)據(jù)地區(qū)i銷量人數(shù)(千人)人均收入(元)11622742450212018032543223375380241312052838567862347616926537827819830088192330245091161952137105553256011252430402012232372442713144226266014103157208815212370260515假設(shè)誤差服從分布,試建立與之間的線性回歸方程并研究相應(yīng)的統(tǒng)計(jì)推斷問(wèn)題。解:我們先看以下這些數(shù)據(jù)的用MATLAB程序來(lái)得

7、到的圖形?;瘖y品銷售數(shù)據(jù)的MATLAB程序是:clearx1=[274,180,375,205,86,265,98,330,195,53,430,372,236,157,370];x2=[2450,3254,3802,2838,2347,3782,3008,2450,2137,2560,4020,4427,2660,2088,2605];y=[162,120,223,131,67,169,81,192,116,55,252,232,144,103,212];scatter3(x1,x2,y)程序結(jié)果是:設(shè)與,的觀測(cè)值之間滿足關(guān)系,其中15相互獨(dú)立,均服從正太分布

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。