資源描述:
《刪失數(shù)據(jù)下的變系數(shù)模型的回歸分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、湖南師范大學(xué)碩士學(xué)位論文刪失數(shù)據(jù)下的變系數(shù)模型的回歸分析姓名:王吉祥申請學(xué)位級別:碩士專業(yè):概率論與數(shù)理統(tǒng)計指導(dǎo)教師:劉萬榮20080501摘要非參數(shù)回歸作為現(xiàn)代統(tǒng)計分析的主要方法之一,它對模型的假設(shè)很少,其最主要的優(yōu)點就是模型具有穩(wěn)健陛,因此得到廣泛的應(yīng)用.非參數(shù)回歸方法本質(zhì)上是局部估計,當(dāng)回歸變量x為一維變量時,非參數(shù)回歸函數(shù)用這些方法一般都能得到很好的估計.但當(dāng)回歸變量是多維時,由于x的局部鄰域包含很少的數(shù)據(jù),用這些估計方法,很難估計出一般的多元非參數(shù)回歸函數(shù),人們把這種現(xiàn)象成為‘維數(shù)禍根’(thecurseofdimension).可是實際中我們經(jīng)常遇到的是高維數(shù)據(jù),
2、因此,高維數(shù)據(jù)分析是統(tǒng)計學(xué)家一直關(guān)心的問題.而變系數(shù)模型(Varying-coefficientModels)是解決‘維數(shù)禍根’問題的一個有效方法.本文考慮變系數(shù)模型pY=芝二%(u)%+s=,(u)x+£,(掌)5=1o(·)=(al(·),?,np(·))Tnz(u),?,唧(t‘)是未知的需要估計的光滑函數(shù),y是實值變量,x=(溉,?,K)r是隨機向量,U是隨機變量,其密度函數(shù)為,(Ⅱ),s是一隨機誤差,且E(eI以x)=0,Yar(£l阢x)=cr2(阢x).然而在現(xiàn)實問題中,如可靠壽命實驗、醫(yī)藥追蹤及生存分析等領(lǐng)域的研究中y常常因為刪失而不能被直接觀測到.設(shè)c表示截
3、斷隨機變量,y與c在給定u和x條件下是獨立隨機變量,記T=rain(Y,c),正=砸n‰,c‘),也=,(璣≤ci)(i=1,2,?,n),其中H)表示某事件的示性函數(shù),當(dāng)沒有出現(xiàn)刪失時6=1,當(dāng)出現(xiàn)刪失時6=0.我們只能觀測到{(阢,X,正,盈);i=1,?,禮).由于響應(yīng)變量存在刪失,不能直接運用完全數(shù)據(jù)下的統(tǒng)計方法,因此需要對刪失數(shù)據(jù)進(jìn)行變換.本文對刪失數(shù)據(jù)采用的變換方法是Class-K方法即把數(shù)據(jù)點(配x,Z6)T變換成(配x,Y+)其中Y’=砸l(仉X,T)+(1一J)≯2(配X,T)妒1(?)和九(?)為變換函數(shù),且EW‘I配X)=m(YlU,X)本文主要采用局部
4、多項式回歸這一非參數(shù)方法及Class-K方法對模型(幸)在數(shù)據(jù)刪失情況下進(jìn)行回歸分析.對模型(水)的系數(shù)函數(shù)光滑程度相同和不同時的情況分別進(jìn)行詳細(xì)討論:(一)當(dāng)系數(shù)函數(shù)光滑程度相同時,用局部線性函數(shù)對其進(jìn)行估計,并證明了其漸近偏差、漸近方差和漸近正態(tài)性.(二)當(dāng)系數(shù)函數(shù)光滑程度不相同時,一般的估計方法就不能達(dá)到最優(yōu)收斂速度,于是就對光滑程度較高的系數(shù)函數(shù)用局部m次多項式進(jìn)行估計,而對其它光滑程度較低的用局部線性函數(shù)對其進(jìn)行估計.并證明了收斂速度、漸近偏差和漸近方差.關(guān)鍵詞:變系數(shù)模型,刪失,局部多項式回歸,Cla.ss-K方法,最優(yōu)收斂速度,漸近偏差,漸近方差,漸近正態(tài)性.I
5、IABSTRACTthenonparametricregressionanalysisisoneoftheleadingmethodsoftherood-ernstatisticalanalysis,Itneel:Isfewhypothesesanditsmainadvantageistobeveryrobust.Soitiswidelyapplied.Theessenceofthenonparametricregressionanalysismethodsislocalestimatororlocalsmoothingtechnique。Ingeneral,thenon-p
6、arametricregressionfunctioniswellestimatedbythenonparametricregressionanalysismethodswhenthevariableXisonedimension.Butthemultivariablenon-parametricregressioncouldnotbewellestimatedbythelocalestimatorsbecausethereisonlyalittledatainthelocalfieldsofthehighdimensionregressionvariableX.Thisph
7、enomenonissaidtobe‘thecurseofdimension’.Duetoalotofthehighdimensiondataisoftenhappened,theanalysisofhighdimensiondataisoneoftheaspectsinwhichalotofstatisticiansareinterested.However,varying-coefficientmodelsisaeffectivemethodtosolvetheproblemof‘thecurseo