資源描述:
《刪失數(shù)據(jù)下的變系數(shù)模型的回歸分析》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、湖南師范大學(xué)碩士學(xué)位論文刪失數(shù)據(jù)下的變系數(shù)模型的回歸分析姓名:王吉祥申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):概率論與數(shù)理統(tǒng)計(jì)指導(dǎo)教師:劉萬(wàn)榮20080501摘要非參數(shù)回歸作為現(xiàn)代統(tǒng)計(jì)分析的主要方法之一,它對(duì)模型的假設(shè)很少,其最主要的優(yōu)點(diǎn)就是模型具有穩(wěn)健陛,因此得到廣泛的應(yīng)用.非參數(shù)回歸方法本質(zhì)上是局部估計(jì),當(dāng)回歸變量x為一維變量時(shí),非參數(shù)回歸函數(shù)用這些方法一般都能得到很好的估計(jì).但當(dāng)回歸變量是多維時(shí),由于x的局部鄰域包含很少的數(shù)據(jù),用這些估計(jì)方法,很難估計(jì)出一般的多元非參數(shù)回歸函數(shù),人們把這種現(xiàn)象成為‘維數(shù)禍根’(thecurseofdimension).可是實(shí)際中我們經(jīng)常遇到的是高維數(shù)據(jù),
2、因此,高維數(shù)據(jù)分析是統(tǒng)計(jì)學(xué)家一直關(guān)心的問題.而變系數(shù)模型(Varying-coefficientModels)是解決‘維數(shù)禍根’問題的一個(gè)有效方法.本文考慮變系數(shù)模型pY=芝二%(u)%+s=,(u)x+£,(掌)5=1o(·)=(al(·),?,np(·))Tnz(u),?,唧(t‘)是未知的需要估計(jì)的光滑函數(shù),y是實(shí)值變量,x=(溉,?,K)r是隨機(jī)向量,U是隨機(jī)變量,其密度函數(shù)為,(Ⅱ),s是一隨機(jī)誤差,且E(eI以x)=0,Yar(£l阢x)=cr2(阢x).然而在現(xiàn)實(shí)問題中,如可靠壽命實(shí)驗(yàn)、醫(yī)藥追蹤及生存分析等領(lǐng)域的研究中y常常因?yàn)閯h失而不能被直接觀測(cè)到.設(shè)c表示截
3、斷隨機(jī)變量,y與c在給定u和x條件下是獨(dú)立隨機(jī)變量,記T=rain(Y,c),正=砸n‰,c‘),也=,(璣≤ci)(i=1,2,?,n),其中H)表示某事件的示性函數(shù),當(dāng)沒有出現(xiàn)刪失時(shí)6=1,當(dāng)出現(xiàn)刪失時(shí)6=0.我們只能觀測(cè)到{(阢,X,正,盈);i=1,?,禮).由于響應(yīng)變量存在刪失,不能直接運(yùn)用完全數(shù)據(jù)下的統(tǒng)計(jì)方法,因此需要對(duì)刪失數(shù)據(jù)進(jìn)行變換.本文對(duì)刪失數(shù)據(jù)采用的變換方法是Class-K方法即把數(shù)據(jù)點(diǎn)(配x,Z6)T變換成(配x,Y+)其中Y’=砸l(仉X,T)+(1一J)≯2(配X,T)妒1(?)和九(?)為變換函數(shù),且EW‘I配X)=m(YlU,X)本文主要采用局部
4、多項(xiàng)式回歸這一非參數(shù)方法及Class-K方法對(duì)模型(幸)在數(shù)據(jù)刪失情況下進(jìn)行回歸分析.對(duì)模型(水)的系數(shù)函數(shù)光滑程度相同和不同時(shí)的情況分別進(jìn)行詳細(xì)討論:(一)當(dāng)系數(shù)函數(shù)光滑程度相同時(shí),用局部線性函數(shù)對(duì)其進(jìn)行估計(jì),并證明了其漸近偏差、漸近方差和漸近正態(tài)性.(二)當(dāng)系數(shù)函數(shù)光滑程度不相同時(shí),一般的估計(jì)方法就不能達(dá)到最優(yōu)收斂速度,于是就對(duì)光滑程度較高的系數(shù)函數(shù)用局部m次多項(xiàng)式進(jìn)行估計(jì),而對(duì)其它光滑程度較低的用局部線性函數(shù)對(duì)其進(jìn)行估計(jì).并證明了收斂速度、漸近偏差和漸近方差.關(guān)鍵詞:變系數(shù)模型,刪失,局部多項(xiàng)式回歸,Cla.ss-K方法,最優(yōu)收斂速度,漸近偏差,漸近方差,漸近正態(tài)性.I
5、IABSTRACTthenonparametricregressionanalysisisoneoftheleadingmethodsoftherood-ernstatisticalanalysis,Itneel:Isfewhypothesesanditsmainadvantageistobeveryrobust.Soitiswidelyapplied.Theessenceofthenonparametricregressionanalysismethodsislocalestimatororlocalsmoothingtechnique。Ingeneral,thenon-p
6、arametricregressionfunctioniswellestimatedbythenonparametricregressionanalysismethodswhenthevariableXisonedimension.Butthemultivariablenon-parametricregressioncouldnotbewellestimatedbythelocalestimatorsbecausethereisonlyalittledatainthelocalfieldsofthehighdimensionregressionvariableX.Thisph
7、enomenonissaidtobe‘thecurseofdimension’.Duetoalotofthehighdimensiondataisoftenhappened,theanalysisofhighdimensiondataisoneoftheaspectsinwhichalotofstatisticiansareinterested.However,varying-coefficientmodelsisaeffectivemethodtosolvetheproblemof‘thecurseo