資源描述:
《比率估計(jì)和回歸估計(jì)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、RatioandRegressionEstimator引例:1802年,拉普拉斯想要估計(jì)法國的人口數(shù)目。他獲得了一個(gè)遍布全國范圍的30個(gè)社區(qū)(commune)的樣本,截至1802年9月23日總共有2037615居民。在包括1802年9月23日以前的三年中,215599個(gè)新生兒在30個(gè)commune。拉普拉斯認(rèn)為30個(gè)commune的每年注冊的新生兒數(shù)為215599/3=71866.33。把2037615按照71866.33來分,拉普拉斯估計(jì)每年每28.35人里有一個(gè)注冊新生兒。具有眾多人口的鄉(xiāng)鎮(zhèn)也就可能有同樣眾多的注冊
2、新生兒,通過用28.35乘以全法國年度新生兒總數(shù)來估計(jì)得出法國人口總數(shù)。調(diào)查中都有輔助信息,抽樣框也通常有每個(gè)單元額外的信息,這些信息能被用來提高我們的估計(jì)精度。一、為什么要使用比率估計(jì)/回歸估計(jì)利用總體的輔助信息提高估計(jì)的精度。輔助指標(biāo)的選擇:第一,輔助指標(biāo)應(yīng)該與調(diào)查指標(biāo)有較好的正的相關(guān)關(guān)系。第二,的抽樣分布較的抽樣分布變動(dòng)性要小得多。第三,輔助指標(biāo)的總體總量或總體均值已知。比率估計(jì)、回歸估計(jì)需要有足夠的樣本量才能保證估計(jì)的有效。有偏估計(jì):當(dāng)樣本量足夠大時(shí),估計(jì)的偏倚趨于0。簡單地想要估計(jì)一個(gè)比率:假定總體由面積不同
3、農(nóng)業(yè)用地構(gòu)成,地谷物的產(chǎn)量,地的面積,B=每畝谷物的平均產(chǎn)量。想要估計(jì)一個(gè)總體總數(shù),但總體大小N是未知的。但是我們知道,于是可以通過來估計(jì)N,由此我們可以使用不同于總數(shù)N的方法而是采用輔助變量來進(jìn)行測量。要估計(jì)漁網(wǎng)中長度長于12cm的魚的總數(shù),抽取一個(gè)魚的隨機(jī)樣本,估計(jì)長度長于12cm的魚所占的比例,用魚的總數(shù)N乘以這個(gè)比例即可得到,但如果N未知不能使用。能稱量漁網(wǎng)中魚的總重量。魚的長度與其重量相關(guān)。調(diào)整來自樣本的估計(jì)量以便它們反映人口統(tǒng)計(jì)學(xué)的總量。在一所具有4000名學(xué)生的大學(xué)提取一個(gè)400個(gè)學(xué)生的簡單隨機(jī)樣本,此樣
4、本可能包含240個(gè)女性,160個(gè)男性,且其中被抽中的84名女性和40名男性計(jì)劃以教學(xué)為畢業(yè)后的職業(yè)。以教學(xué)為職業(yè)的總量估計(jì):調(diào)整后的總量估計(jì):比率估計(jì)量被用來對無回答進(jìn)行調(diào)整。設(shè)抽取一個(gè)行業(yè)的樣本:令為行業(yè)花費(fèi)在健康保險(xiǎn)上的金額,為行業(yè)的雇員數(shù)。假定對總體中的每個(gè)行業(yè)均已知.我們希望一個(gè)行業(yè)花費(fèi)在健康保險(xiǎn)上的金額與雇員數(shù)相關(guān)。某些行業(yè)在調(diào)查中可能涉及不到。估計(jì)保險(xiǎn)費(fèi)用的總花銷時(shí)調(diào)整無回答的方法之一是用總體數(shù)乘以比率。二、RatioEstimator在SRS條件下,輔助指標(biāo),其總體均值(總量)已知,則有:例1,對以下假設(shè)
5、總體(N=6),用簡單隨機(jī)抽樣抽取的樣本,比較簡單隨機(jī)抽樣比估計(jì)及簡單估計(jì)的性質(zhì)。序號123456平均值01358104.5131118294618樣本yy1xx1簡單估計(jì)比率估計(jì)11,2130121821,31110361831,4118059.517.141,5129081516.87551,614601023.521.1562,331113715.7572,43181510.515.7582,532918161692,634611024.520.04545103,411183514.516.3125113,511
6、29382016.36364123,6114631028.519.73077134,518295823.516.26923144,618465103219.2155,6294681037.518.75總共抽取個(gè)樣本,簡單估計(jì)為:,比率估計(jì):。;;(偏倚程度);評價(jià):簡單估計(jì)是無偏的,而比估計(jì)是有偏的。簡單估計(jì)量的方差遠(yuǎn)遠(yuǎn)大于比估計(jì)量的方差,比估計(jì)的偏差不大,其均方誤差也比簡單估計(jì)的小得多。因此對這個(gè)總體,比估計(jì)比簡單估計(jì)的效率高。三、比率估計(jì)的性質(zhì)偏倚量會(huì)小,如果:樣本量很大;抽樣比很大;很大;很小;相關(guān)系數(shù)接近于1。
7、比率估計(jì)的近似方差:;四、比率估計(jì)的效率1、與簡單估計(jì)的比較簡單估計(jì)量無偏,而比率估計(jì)量漸近無偏。因此這里只比較當(dāng)n比較大的情形。比率估計(jì)量優(yōu)于簡單估計(jì)量的條件是:(正高度相關(guān))2、比率估計(jì)成為最優(yōu)線性無偏估計(jì)的條件(1)與的關(guān)系是過原點(diǎn)的直線。(2)對這條直線的方差與成比例。則比率估計(jì)是最優(yōu)線性無偏估計(jì)(BLUE)。例2,某縣在對船舶調(diào)查月完成的貨運(yùn)量進(jìn)行調(diào)查時(shí),對運(yùn)管部門登記的船舶臺帳進(jìn)行整理后獲得注冊船舶2860艘,載重噸位154626噸,從2860艘船舶中抽取了一個(gè)的簡單隨機(jī)樣本,調(diào)查得到樣本船舶調(diào)查月完成的貨
8、運(yùn)量及其載重噸位如下表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運(yùn)量。1780100621701202150050718231503100550814508043761091582056002010137050該縣船舶在調(diào)查月完成貨運(yùn)量的比率估計(jì)為:;用簡單估計(jì)對貨運(yùn)量進(jìn)行估計(jì):;(注!實(shí)際中對于樣本量較小的情形,使用比率估計(jì)量時(shí)