資源描述:
《左刪失右截斷數(shù)據(jù)的分位數(shù)的固定寬度序貫置信區(qū)間估計》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、左刪失右截斷數(shù)據(jù)的分位數(shù)的固定寬度序貫置信區(qū)間估計 一、引言 在生存分析研究中,一些個體生存時間的開始點在試驗開始之前,所以人們無法觀察到這些個體在進入試驗之前的數(shù)據(jù)。這樣所獲得的個體數(shù)據(jù)就是左截斷數(shù)據(jù)。如果個體一旦進入試驗,人們可能在試驗結(jié)束之前未能完全觀察到這個個體的全部過程,因此引起了右刪失的數(shù)據(jù)。這樣的左截斷右刪失數(shù)據(jù)是生存分析中常常遇到的數(shù)據(jù)之一。具體地說,設(shè)(X,T,Y)表示三維的隨機變量,其中X為感興趣的隨機變量,具有連續(xù)的分布函數(shù)F;T是左截斷隨機變量具有分布函數(shù)G,以及Y是右刪失隨機量
2、具有分布L。假定X是與(T,Y)獨立的,但T和Y可以是相關(guān)的。所謂左截斷右刪失數(shù)據(jù)是:如果Z≥T,(Z,T,δ)是可以觀察的,其中Z=X∧Y=min(X,Y)和δ=I(X≤Y)。而當(dāng)Z<T時,人們無法觀察到任何數(shù)據(jù)。不失一般性,設(shè)α≡P(T≤Z)>0和ansperger[12]研究了這樣的置信區(qū)間,Gürler,Stute,Wang[4]考慮了左截斷的情況?! ≡谏娣治鲋校蜇灧椒ㄊ巧锝y(tǒng)計中一種廣泛應(yīng)用的方法之一,它的優(yōu)點是節(jié)約成本和試驗時間,在試驗中可以由它來控制所需的時間和成本進行抽樣。在實際工作
3、中,試驗者往往要求在給定的置信水平和滿足一定的精度下,對所感興趣的量進行統(tǒng)計估計和推斷,同時不要浪費太多的資源。因此,此時的序貫區(qū)間估計就是一種很好的選擇。具體體現(xiàn)是,人們首先要求統(tǒng)計推斷滿足一定精度,即是給定固定區(qū)間的長度,當(dāng)置信水平已知(即給定某個置信水平)的情況下進行抽樣。這些方法在大多數(shù)的應(yīng)用中是很乎合實際要求的。這就是所謂固定寬度的序貫置信區(qū)間估計。本文就在這方面進行研究?! 榱俗C明分位數(shù)的固定寬度序貫置信區(qū)間的漸近性質(zhì),我們給出一個擴展的p[,n]分位估計的Bahadur的強表示定理,其中p
4、[,n]可以是一個隨機量。當(dāng)ξ[,pn]是ξ[,p]強相合估計。在某些簡單的條件下,的Bahadur表示是 附圖 其中f=F'和R[,n]是剩余項。在下一節(jié),我們給出剩余項R[,n]的幾乎處處漸近收斂速度,其中是一列收斂于p的隨機變量。對于特別的應(yīng)用,p[,n]一般定義為乘積限估計的漸近方差的泛函。此表示定理在推導(dǎo)分位數(shù)估計的大樣本性質(zhì)上具有廣泛的應(yīng)用,此結(jié)果是[13]中重要結(jié)果的推廣。為了獲得分位數(shù)的置信區(qū)間估計,這種推廣是必要的。在此節(jié)的最后,給出相合的漸近方差估計。為方便,假設(shè)Y和T是非負的隨機
5、變量。在本文,我們多次用到如下的積分條件,對于任意T<T[,W], 附圖 根據(jù)[7]的結(jié)果,我們表述如下的引理 引理1.1假定a[,G]<a[,W]或a[,G]=a[,W]和(3)成立。當(dāng)a[,W]<x≤b<b[,W],一致地有 附圖 其中表示概率收斂?! ≡谟覄h失數(shù)據(jù)下,Cheng[14],Aly,,Horváth[15],Lo,Singh[16]研究了Bahadur表示中剩余項R[,n](p)的幾乎處處收斂速度。Gijbels,Veraverbeke[10,11]給出了Ghosh型的弱表示定
6、理。Zhou[17]考慮了光滑分位數(shù)估計和給出了其一致Bahadur表示定理。Padgett[18]獲得了些核光滑的分位數(shù)估計的漸近性質(zhì)。Gürler,Stute,Wang[4]首先考慮了左截數(shù)據(jù)下的分位數(shù)估計的各種漸近性質(zhì)?! 《?、Bahadure表示定理及固定長度置信區(qū)間 在這節(jié),給出分位數(shù)估計表示式(2)的結(jié)果。為些我們需要如下的條件。 條件(i)對于T<T[,W], 附圖 附圖 雖然f的估計容易獲得,但是卷入麻煩的窗寬選擇,因此盡量不用其非參數(shù)估計。使用Y[,i]的次序統(tǒng)計量可以簡單地構(gòu)
7、造分位數(shù)的置信區(qū)間,克服使用f的非參數(shù)估計的窗寬選擇的麻煩。這置信區(qū)間是 附圖 關(guān)于固定長度的序貫區(qū)間方法(11)及其所要求的隨機樣本大小τ,我們?nèi)菀淄茖?dǎo)出如下定理。 附圖 附圖 在這里,我們進行一個小的計算機模型試驗,目的是在左截斷右刪失數(shù)據(jù)下,檢驗分位數(shù)估計序貫方法的有效性,以及在給定精度下,如何有效地進行序貫試驗,即在更短的試驗時間里,獲得合乎精度要求的分位數(shù)估計。我們的隨機試驗是在如下的條件下進行的。設(shè)(X,T,Y)分別來自指數(shù)分布的隨機變量,對應(yīng)于指數(shù)分布的參數(shù)分別是θ[,1],θ[,
8、2],θ[,3],它們的值分別取1,1.5,0.25。共進行500次試驗,每次產(chǎn)生樣本數(shù)分別是100,200和500。因此,在這些設(shè)計下,被刪失的數(shù)據(jù)占20%而且被截斷的占45%。獲得的結(jié)果如上表。其它參數(shù)的組合下進行了同樣的模擬試驗,所獲結(jié)果與此情況相似,故略。在此我們僅列出樣本為200的結(jié)果,其它情況略?! ”碇械氖侵笖?shù)分布p-分位數(shù)的估計,對于每個分位數(shù)的序貫估計分別取3種不同的精度。d[,1]的取法是全樣本下的分位數(shù)估