資源描述:
《比率估計和回歸估計》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在行業(yè)資料-天天文庫。
1、RatioandRegressionEstimator引例:1802年,拉普拉斯想要估計法國的人口數(shù)目。他獲得了一個遍布全國范圍的30個社區(qū)(commune)的樣本,截至1802年9月23日總共有2037615居民。在包括1802年9月23日以前的三年中,215599個新生兒在30個commune。拉普拉斯認為30個commune的每年注冊的新生兒數(shù)為215599/3=71866.33。把2037615按照71866.33來分,拉普拉斯估計每年每28.35人里有一個注冊新生兒。具有眾多人口的鄉(xiāng)鎮(zhèn)也就可能有同樣眾多的注冊新生兒,通過用28.35
2、乘以全法國年度新生兒總數(shù)來估計得出法國人口總數(shù)。調(diào)查中都有輔助信息,抽樣框也通常有每個單元額外的信息,這些信息能被用來提高我們的估計精度。一、為什么要使用比率估計/回歸估計利用總體的輔助信息提高估計的精度。輔助指標的選擇:第一,輔助指標應該與調(diào)查指標有較好的正的相關關系。第二,的抽樣分布較的抽樣分布變動性要小得多。第三,輔助指標的總體總量或總體均值已知。比率估計、回歸估計需要有足夠的樣本量才能保證估計的有效。有偏估計:當樣本量足夠大時,估計的偏倚趨于0。簡單地想要估計一個比率:假定總體由面積不同農(nóng)業(yè)用地構成,地谷物的產(chǎn)量,地的面積,B=每畝谷
3、物的平均產(chǎn)量。想要估計一個總體總數(shù),但總體大小N是未知的。但是我們知道,于是可以通過來估計N,由此我們可以使用不同于總數(shù)N的方法而是采用輔助變量來進行測量。要估計漁網(wǎng)中長度長于12cm的魚的總數(shù),抽取一個魚的隨機樣本,估計長度長于12cm的魚所占的比例,用魚的總數(shù)N乘以這個比例即可得到,但如果N未知不能使用。能稱量漁網(wǎng)中魚的總重量。魚的長度與其重量相關。調(diào)整來自樣本的估計量以便它們反映人口統(tǒng)計學的總量。在一所具有4000名學生的大學提取一個400個學生的簡單隨機樣本,此樣本可能包含240個女性,160個男性,且其中被抽中的84名女性和40名男
4、性計劃以教學為畢業(yè)后的職業(yè)。以教學為職業(yè)的總量估計:調(diào)整后的總量估計:比率估計量被用來對無回答進行調(diào)整。設抽取一個行業(yè)的樣本:令為行業(yè)花費在健康保險上的金額,為行業(yè)的雇員數(shù)。假定對總體中的每個行業(yè)均已知.我們希望一個行業(yè)花費在健康保險上的金額與雇員數(shù)相關。某些行業(yè)在調(diào)查中可能涉及不到。估計保險費用的總花銷時調(diào)整無回答的方法之一是用總體數(shù)乘以比率。二、RatioEstimator在SRS條件下,輔助指標,其總體均值(總量)已知,則有:例1,對以下假設總體(N=6),用簡單隨機抽樣抽取的樣本,比較簡單隨機抽樣比估計及簡單估計的性質(zhì)。序號12345
5、6平均值01358104.5131118294618樣本yy1xx1簡單估計比率估計11,2130121821,31110361831,4118059.517.141,5129081516.87551,614601023.521.1562,331113715.7572,43181510.515.7582,532918161692,634611024.520.04545103,411183514.516.3125113,51129382016.36364123,6114631028.519.73077134,518295823.516.2692
6、3144,618465103219.2155,6294681037.518.75總共抽取個樣本,簡單估計為:,比率估計:。;;(偏倚程度);評價:簡單估計是無偏的,而比估計是有偏的。簡單估計量的方差遠遠大于比估計量的方差,比估計的偏差不大,其均方誤差也比簡單估計的小得多。因此對這個總體,比估計比簡單估計的效率高。三、比率估計的性質(zhì)偏倚量會小,如果:樣本量很大;抽樣比很大;很大;很??;相關系數(shù)接近于1。比率估計的近似方差:;四、比率估計的效率1、與簡單估計的比較簡單估計量無偏,而比率估計量漸近無偏。因此這里只比較當n比較大的情形。比率估計量優(yōu)于
7、簡單估計量的條件是:(正高度相關)2、比率估計成為最優(yōu)線性無偏估計的條件(1)與的關系是過原點的直線。(2)對這條直線的方差與成比例。則比率估計是最優(yōu)線性無偏估計(BLUE)。例2,某縣在對船舶調(diào)查月完成的貨運量進行調(diào)查時,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸,從2860艘船舶中抽取了一個的簡單隨機樣本,調(diào)查得到樣本船舶調(diào)查月完成的貨運量及其載重噸位如下表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運量。1780100621701202150050718231503100550814508043761
8、091582056002010137050該縣船舶在調(diào)查月完成貨運量的比率估計為:;用簡單估計對貨運量進行估計:;(注!實際中對于樣本量較小的情形,使用比率估計量時