資源描述:
《左刪失右截斷數據的分位數的固定寬度序貫置信區(qū)間估計》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、左刪失右截斷數據的分位數的固定寬度序貫置信區(qū)間估計 一、引言 在生存分析研究中,一些個體生存時間的開始點在試驗開始之前,所以人們無法觀察到這些個體在進入試驗之前的數據。這樣所獲得的個體數據就是左截斷數據。如果個體一旦進入試驗,人們可能在試驗結束之前未能完全觀察到這個個體的全部過程,因此引起了右刪失的數據。這樣的左截斷右刪失數據是生存分析中常常遇到的數據之一。具體地說,設(X,T,Y)表示三維的隨機變量,其中X為感興趣的隨機變量,具有連續(xù)的分布函數F;T是左截斷隨機變量具有分布函數G,以及Y是右刪失隨機量
2、具有分布L。假定X是與(T,Y)獨立的,但T和Y可以是相關的。所謂左截斷右刪失數據是:如果Z≥T,(Z,T,δ)是可以觀察的,其中Z=X∧Y=min(X,Y)和δ=I(X≤Y)。而當Z<T時,人們無法觀察到任何數據。不失一般性,設α≡P(T≤Z)>0和ansperger[12]研究了這樣的置信區(qū)間,Gürler,Stute,Wang[4]考慮了左截斷的情況。 在生存分析中,序貫方法是生物統(tǒng)計中一種廣泛應用的方法之一,它的優(yōu)點是節(jié)約成本和試驗時間,在試驗中可以由它來控制所需的時間和成本進行抽樣。在實際工作
3、中,試驗者往往要求在給定的置信水平和滿足一定的精度下,對所感興趣的量進行統(tǒng)計估計和推斷,同時不要浪費太多的資源。因此,此時的序貫區(qū)間估計就是一種很好的選擇。具體體現是,人們首先要求統(tǒng)計推斷滿足一定精度,即是給定固定區(qū)間的長度,當置信水平已知(即給定某個置信水平)的情況下進行抽樣。這些方法在大多數的應用中是很乎合實際要求的。這就是所謂固定寬度的序貫置信區(qū)間估計。本文就在這方面進行研究。 為了證明分位數的固定寬度序貫置信區(qū)間的漸近性質,我們給出一個擴展的p[,n]分位估計的Bahadur的強表示定理,其中p
4、[,n]可以是一個隨機量。當ξ[,pn]是ξ[,p]強相合估計。在某些簡單的條件下,的Bahadur表示是 附圖 其中f=F'和R[,n]是剩余項。在下一節(jié),我們給出剩余項R[,n]的幾乎處處漸近收斂速度,其中是一列收斂于p的隨機變量。對于特別的應用,p[,n]一般定義為乘積限估計的漸近方差的泛函。此表示定理在推導分位數估計的大樣本性質上具有廣泛的應用,此結果是[13]中重要結果的推廣。為了獲得分位數的置信區(qū)間估計,這種推廣是必要的。在此節(jié)的最后,給出相合的漸近方差估計。為方便,假設Y和T是非負的隨機
5、變量。在本文,我們多次用到如下的積分條件,對于任意T<T[,W], 附圖 根據[7]的結果,我們表述如下的引理 引理1.1假定a[,G]<a[,W]或a[,G]=a[,W]和(3)成立。當a[,W]<x≤b<b[,W],一致地有 附圖 其中表示概率收斂?! ≡谟覄h失數據下,Cheng[14],Aly,,Horváth[15],Lo,Singh[16]研究了Bahadur表示中剩余項R[,n](p)的幾乎處處收斂速度。Gijbels,Veraverbeke[10,11]給出了Ghosh型的弱表示定
6、理。Zhou[17]考慮了光滑分位數估計和給出了其一致Bahadur表示定理。Padgett[18]獲得了些核光滑的分位數估計的漸近性質。Gürler,Stute,Wang[4]首先考慮了左截數據下的分位數估計的各種漸近性質?! 《?、Bahadure表示定理及固定長度置信區(qū)間 在這節(jié),給出分位數估計表示式(2)的結果。為些我們需要如下的條件。 條件(i)對于T<T[,W], 附圖 附圖 雖然f的估計容易獲得,但是卷入麻煩的窗寬選擇,因此盡量不用其非參數估計。使用Y[,i]的次序統(tǒng)計量可以簡單地構
7、造分位數的置信區(qū)間,克服使用f的非參數估計的窗寬選擇的麻煩。這置信區(qū)間是 附圖 關于固定長度的序貫區(qū)間方法(11)及其所要求的隨機樣本大小τ,我們容易推導出如下定理?! 「綀D 附圖 在這里,我們進行一個小的計算機模型試驗,目的是在左截斷右刪失數據下,檢驗分位數估計序貫方法的有效性,以及在給定精度下,如何有效地進行序貫試驗,即在更短的試驗時間里,獲得合乎精度要求的分位數估計。我們的隨機試驗是在如下的條件下進行的。設(X,T,Y)分別來自指數分布的隨機變量,對應于指數分布的參數分別是θ[,1],θ[,
8、2],θ[,3],它們的值分別取1,1.5,0.25。共進行500次試驗,每次產生樣本數分別是100,200和500。因此,在這些設計下,被刪失的數據占20%而且被截斷的占45%。獲得的結果如上表。其它參數的組合下進行了同樣的模擬試驗,所獲結果與此情況相似,故略。在此我們僅列出樣本為200的結果,其它情況略?! ”碇械氖侵笖捣植紁-分位數的估計,對于每個分位數的序貫估計分別取3種不同的精度。d[,1]的取法是全樣本下的分位數估