資源描述:
《線性模型參數(shù)的多種估計方法的隨機模擬》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、線性模型參數(shù)的多種估計方法的隨機模擬問題的陳述:人們常常使用線性模型對數(shù)據(jù)進行回歸與預測,在假定了數(shù)據(jù)的自變量X與響應變量Y具有線性關系Y=α+β·X+ε之后,我們可以對參數(shù)值進行估計,從而達到對模型進行估計的效果。這是本次模擬要處理的主要問題,即各種估計方式的優(yōu)劣判別。目的的陳述:對于給定的數(shù)據(jù)X,Y(兩列數(shù)據(jù)),我們將對4種距離:d1(a,b)=
2、(y–a–b*x)/b2+1
3、;d2(a,b)=
4、(y–a–b*x)
5、;d3(a,b)=
6、(y–a–b*x)/b
7、;d4(a,b)=
8、y–a–b*x2/b
9、與3種計算方式f1a,b=sum
10、(d(a,b))、f2a,b=max?(d(a,b))、f3a,b=sum(d(a,b)^2)(每個元素平方)進行優(yōu)劣比較。試驗的設計:對一組給定的數(shù)據(jù)X,Y,我們將通過極小化目標函數(shù)f1、f2、f3的方式來求得a與b。第零部分,比較通過隨機數(shù)產(chǎn)生的樣本點與固定樣本點對參數(shù)估計帶來的影響。第一部分,比較距離函數(shù)d1、d2、d3、d4對參數(shù)估計帶來的影響。方法如下:對每一個計算方式f1、f2、f3,與每一組數(shù)據(jù),我們分別計算使用4種不同距離函數(shù)得到的參數(shù)值并且將其對比。第二部分,比較計算方式f1、f2、f3的優(yōu)劣。方法如下:對4種距離中的
11、每一種,我們都用3種計算方式來得到估計的參數(shù)值,并將其對比。關于參數(shù)估計的其他興趣:參數(shù)估計值的漸近性質。對上文的任意一個單項的檢驗,我們都遵從如下步驟:Step1:產(chǎn)生n個樣本點(固定樣本點等距離取定即可,隨機樣本點Xi~iidU(0,1)或Xi~iidN(2,1)),產(chǎn)生對應于n個樣本點的隨機誤差?i~iidN(0,σ2),σ2可以取1與0.1,或者?i~iidCauchy(0,1)。對應的Yi=α+β·Xi+?i。從而,我們得到了“數(shù)據(jù)”,(X1,Y1),(X2,Y2)…(Xn,Yn)。Step2:利用上文產(chǎn)生的“數(shù)據(jù)”,我們分別
12、通過最小化對應的f函數(shù)的方式來得到參數(shù)α與β的估計,a與b。Step3:重復Step1&Step2n_repeat次,得到若干組估計值a、bStep4:對得到的估計數(shù)據(jù)進行分析。1、通過方差、偏倚直接描述估計值,2、通過假設檢驗的方式比較不同的計算方式得來的結果。第零部分:探究X取固定樣本點與隨機樣本點的關系(代碼統(tǒng)一見1.txt,在代碼里,可供修改的參數(shù)處已經(jīng)做好批注)1、?i~iidN(0,σ2),σ2=0.1,比較X~U0,1與X在0,1中等距取樣本點兩者在參數(shù)估計上的效果。計算方式采用d2與f3的結合。單次試驗樣本數(shù)n=100,
13、試驗重復數(shù)n_repeat=10000。結果展示:Part1:采用隨機樣本點得到的a、b的估計值的直方圖均值與方差:有關a的估計值:mean=0.9999975,var=0.0004027有關b的估計值:mean=2.000021,var=0.00120413采用固定樣本點得到的a、b的估計值的直方圖均值與方差:有關a的估計值:mean=1.000002,var=0.0004017有關b的估計值:mean=2.000052,var=0.0012546Part2:檢驗兩種估計方式的均值和方差是否相同1)均值是否相同?由于這里兩種估計方式的
14、樣本數(shù)量都高達10000,遠大于30,我們可以認為這是大樣本的檢驗,我們計算兩次估計得到的樣本的z值對a的估計值:z=meanx1-mean(x2)var(x1)10000+var(x2)10000=-0.01539,這個值的絕對值遠遠小于1.96(95%significance),于是我們便沒有充分的理由拒絕兩者均值相同的假設。對b的估計值:同上計算得到z=-0.06282,同樣,我們也沒有充分的理由拒絕兩者有相同的期望1)方差是否相同?計算F-ratio,F(xiàn)=max{var(x1)var(x2),var(x2)var(x1)},對自
15、由度為(9999,9999)的F分布,F(xiàn)0.05=1.033447,F(xiàn)0.01=1.047632對a的估計值:F=1.002618F=1.041891>F0.05,同樣我們有95%可信度來拒絕關于b的估計兩者具有相同的方差,不過,沒有99%的可信度。Part3:綜上所述,在d2,f3這一計算方式下,樣本點取值是[0,1]均勻隨機變量或是給定的等距節(jié)點對參數(shù)值的估計在均值層面沒有影響,但在β的估計上,兩者的離散程度不同。1、?i~iidN(0,σ2),σ
16、2=1,比較X~N2,1與X在-1,3中等距取樣本點兩者在參數(shù)估計上的效果。計算方式采用d2與f3的結合。單次試驗樣本數(shù)n=100,試驗重復數(shù)n_repeat=10000。結果展示:Part1:采用隨機樣本