資源描述:
《比率估計和回歸估計.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、RatioandRegressionEstimator引例:1802年,拉普拉斯想要估計法國的人口數(shù)目。他獲得了一個遍布全國范圍的30個社區(qū)(commune)的樣本,截至1802年9月23日總共有2037615居民。在包括1802年9月23日以前的三年中,215599個新生兒在30個commune。拉普拉斯認為30個commune的每年注冊的新生兒數(shù)為215599/3=71866.33。把2037615按照71866.33來分,拉普拉斯估計每年每28.35人里有一個注冊新生兒。具有眾多人口的鄉(xiāng)鎮(zhèn)也
2、就可能有同樣眾多的注冊新生兒,通過用28.35乘以全法國年度新生兒總數(shù)來估計得出法國人口總數(shù)。調(diào)查中都有輔助信息,抽樣框也通常有每個單元額外的信息,這些信息能被用來提高我們的估計精度。一、為什么要使用比率估計/回歸估計利用總體的輔助信息提高估計的精度。輔助指標(biāo)的選擇:第一,輔助指標(biāo)應(yīng)該與調(diào)查指標(biāo)有較好的正的相關(guān)關(guān)系。第二,的抽樣分布較的抽樣分布變動性要小得多。第三,輔助指標(biāo)的總體總量或總體均值已知。比率估計、回歸估計需要有足夠的樣本量才能保證估計的有效。有偏估計:當(dāng)樣本量足夠大時,估計的偏倚趨于0
3、。簡單地想要估計一個比率:假定總體由面積不同農(nóng)業(yè)用地構(gòu)成,地谷物的產(chǎn)量,地的面積,B=每畝谷物的平均產(chǎn)量。想要估計一個總體總數(shù),但總體大小N是未知的。但是我們知道,于是可以通過來估計N,由此我們可以使用不同于總數(shù)N的方法而是采用輔助變量來進行測量。要估計漁網(wǎng)中長度長于12cm的魚的總數(shù),抽取一個魚的隨機樣本,估計長度長于12cm的魚所占的比例,用魚的總數(shù)N乘以這個比例即可得到,但如果N未知不能使用。能稱量漁網(wǎng)中魚的總重量。魚的長度與其重量相關(guān)。調(diào)整來自樣本的估計量以便它們反映人口統(tǒng)計學(xué)的總量。在一
4、所具有4000名學(xué)生的大學(xué)提取一個400個學(xué)生的簡單隨機樣本,此樣本可能包含240個女性,160個男性,且其中被抽中的84名女性和40名男性計劃以教學(xué)為畢業(yè)后的職業(yè)。以教學(xué)為職業(yè)的總量估計:調(diào)整后的總量估計:比率估計量被用來對無回答進行調(diào)整。設(shè)抽取一個行業(yè)的樣本:令為行業(yè)花費在健康保險上的金額,為行業(yè)的雇員數(shù)。假定對總體中的每個行業(yè)均已知.我們希望一個行業(yè)花費在健康保險上的金額與雇員數(shù)相關(guān)。某些行業(yè)在調(diào)查中可能涉及不到。估計保險費用的總花銷時調(diào)整無回答的方法之一是用總體數(shù)乘以比率。二、RatioE
5、stimator在SRS條件下,輔助指標(biāo),其總體均值(總量)已知,則有:例1,對以下假設(shè)總體(N=6),用簡單隨機抽樣抽取的樣本,比較簡單隨機抽樣比估計及簡單估計的性質(zhì)。序號123456平均值01358104.5131118294618樣本yy1xx1簡單估計比率估計11,2130121821,31110361831,4118059.517.141,5129081516.87551,614601023.521.1562,331113715.7572,43181510.515.7582,532918
6、161692,634611024.520.04545103,411183514.516.3125113,51129382016.36364123,6114631028.519.73077134,518295823.516.26923144,618465103219.2155,6294681037.518.75總共抽取個樣本,簡單估計為:,比率估計:。;;(偏倚程度);評價:簡單估計是無偏的,而比估計是有偏的。簡單估計量的方差遠遠大于比估計量的方差,比估計的偏差不大,其均方誤差也比簡單估計的小得多。
7、因此對這個總體,比估計比簡單估計的效率高。三、比率估計的性質(zhì)偏倚量會小,如果:樣本量很大;抽樣比很大;很大;很小;相關(guān)系數(shù)接近于1。比率估計的近似方差:;四、比率估計的效率1、與簡單估計的比較簡單估計量無偏,而比率估計量漸近無偏。因此這里只比較當(dāng)n比較大的情形。比率估計量優(yōu)于簡單估計量的條件是:(正高度相關(guān))2、比率估計成為最優(yōu)線性無偏估計的條件(1)與的關(guān)系是過原點的直線。(2)對這條直線的方差與成比例。則比率估計是最優(yōu)線性無偏估計(BLUE)。例2,某縣在對船舶調(diào)查月完成的貨運量進行調(diào)查時,對
8、運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸,從2860艘船舶中抽取了一個的簡單隨機樣本,調(diào)查得到樣本船舶調(diào)查月完成的貨運量及其載重噸位如下表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運量。1780100621701202150050718231503100550814508043761091582056002010137050該縣船舶在調(diào)查月完成貨運量的比率估計為:;用簡單估計對貨運量進行估計:;(注!實際中對于樣本量較小的情形,使用比率估計量時