線性模型參數(shù)的多種估計方法的隨機(jī)模擬

線性模型參數(shù)的多種估計方法的隨機(jī)模擬

ID:1337574

大?。?34.65 KB

頁數(shù):9頁

時間:2017-11-10

線性模型參數(shù)的多種估計方法的隨機(jī)模擬_第1頁
線性模型參數(shù)的多種估計方法的隨機(jī)模擬_第2頁
線性模型參數(shù)的多種估計方法的隨機(jī)模擬_第3頁
線性模型參數(shù)的多種估計方法的隨機(jī)模擬_第4頁
線性模型參數(shù)的多種估計方法的隨機(jī)模擬_第5頁
資源描述:

《線性模型參數(shù)的多種估計方法的隨機(jī)模擬》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、線性模型參數(shù)的多種估計方法的隨機(jī)模擬問題的陳述:人們常常使用線性模型對數(shù)據(jù)進(jìn)行回歸與預(yù)測,在假定了數(shù)據(jù)的自變量X與響應(yīng)變量Y具有線性關(guān)系Y=α+β·X+ε之后,我們可以對參數(shù)值進(jìn)行估計,從而達(dá)到對模型進(jìn)行估計的效果。這是本次模擬要處理的主要問題,即各種估計方式的優(yōu)劣判別。目的的陳述:對于給定的數(shù)據(jù)X,Y(兩列數(shù)據(jù)),我們將對4種距離:d1(a,b)=

2、(y–a–b*x)/b2+1

3、;d2(a,b)=

4、(y–a–b*x)

5、;d3(a,b)=

6、(y–a–b*x)/b

7、;d4(a,b)=

8、y–a–b*x2/b

9、與3種計算方式f1a,b=sum

10、(d(a,b))、f2a,b=max?(d(a,b))、f3a,b=sum(d(a,b)^2)(每個元素平方)進(jìn)行優(yōu)劣比較。試驗的設(shè)計:對一組給定的數(shù)據(jù)X,Y,我們將通過極小化目標(biāo)函數(shù)f1、f2、f3的方式來求得a與b。第零部分,比較通過隨機(jī)數(shù)產(chǎn)生的樣本點與固定樣本點對參數(shù)估計帶來的影響。第一部分,比較距離函數(shù)d1、d2、d3、d4對參數(shù)估計帶來的影響。方法如下:對每一個計算方式f1、f2、f3,與每一組數(shù)據(jù),我們分別計算使用4種不同距離函數(shù)得到的參數(shù)值并且將其對比。第二部分,比較計算方式f1、f2、f3的優(yōu)劣。方法如下:對4種距離中的

11、每一種,我們都用3種計算方式來得到估計的參數(shù)值,并將其對比。關(guān)于參數(shù)估計的其他興趣:參數(shù)估計值的漸近性質(zhì)。對上文的任意一個單項的檢驗,我們都遵從如下步驟:Step1:產(chǎn)生n個樣本點(固定樣本點等距離取定即可,隨機(jī)樣本點Xi~iidU(0,1)或Xi~iidN(2,1)),產(chǎn)生對應(yīng)于n個樣本點的隨機(jī)誤差?i~iidN(0,σ2),σ2可以取1與0.1,或者?i~iidCauchy(0,1)。對應(yīng)的Yi=α+β·Xi+?i。從而,我們得到了“數(shù)據(jù)”,(X1,Y1),(X2,Y2)…(Xn,Yn)。Step2:利用上文產(chǎn)生的“數(shù)據(jù)”,我們分別

12、通過最小化對應(yīng)的f函數(shù)的方式來得到參數(shù)α與β的估計,a與b。Step3:重復(fù)Step1&Step2n_repeat次,得到若干組估計值a、bStep4:對得到的估計數(shù)據(jù)進(jìn)行分析。1、通過方差、偏倚直接描述估計值,2、通過假設(shè)檢驗的方式比較不同的計算方式得來的結(jié)果。第零部分:探究X取固定樣本點與隨機(jī)樣本點的關(guān)系(代碼統(tǒng)一見1.txt,在代碼里,可供修改的參數(shù)處已經(jīng)做好批注)1、?i~iidN(0,σ2),σ2=0.1,比較X~U0,1與X在0,1中等距取樣本點兩者在參數(shù)估計上的效果。計算方式采用d2與f3的結(jié)合。單次試驗樣本數(shù)n=100,

13、試驗重復(fù)數(shù)n_repeat=10000。結(jié)果展示:Part1:采用隨機(jī)樣本點得到的a、b的估計值的直方圖均值與方差:有關(guān)a的估計值:mean=0.9999975,var=0.0004027有關(guān)b的估計值:mean=2.000021,var=0.00120413采用固定樣本點得到的a、b的估計值的直方圖均值與方差:有關(guān)a的估計值:mean=1.000002,var=0.0004017有關(guān)b的估計值:mean=2.000052,var=0.0012546Part2:檢驗兩種估計方式的均值和方差是否相同1)均值是否相同?由于這里兩種估計方式的

14、樣本數(shù)量都高達(dá)10000,遠(yuǎn)大于30,我們可以認(rèn)為這是大樣本的檢驗,我們計算兩次估計得到的樣本的z值對a的估計值:z=meanx1-mean(x2)var(x1)10000+var(x2)10000=-0.01539,這個值的絕對值遠(yuǎn)遠(yuǎn)小于1.96(95%significance),于是我們便沒有充分的理由拒絕兩者均值相同的假設(shè)。對b的估計值:同上計算得到z=-0.06282,同樣,我們也沒有充分的理由拒絕兩者有相同的期望1)方差是否相同?計算F-ratio,F(xiàn)=max{var(x1)var(x2),var(x2)var(x1)},對自

15、由度為(9999,9999)的F分布,F(xiàn)0.05=1.033447,F(xiàn)0.01=1.047632對a的估計值:F=1.002618F=1.041891>F0.05,同樣我們有95%可信度來拒絕關(guān)于b的估計兩者具有相同的方差,不過,沒有99%的可信度。Part3:綜上所述,在d2,f3這一計算方式下,樣本點取值是[0,1]均勻隨機(jī)變量或是給定的等距節(jié)點對參數(shù)值的估計在均值層面沒有影響,但在β的估計上,兩者的離散程度不同。1、?i~iidN(0,σ2),σ

16、2=1,比較X~N2,1與X在-1,3中等距取樣本點兩者在參數(shù)估計上的效果。計算方式采用d2與f3的結(jié)合。單次試驗樣本數(shù)n=100,試驗重復(fù)數(shù)n_repeat=10000。結(jié)果展示:Part1:采用隨機(jī)樣本

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。