資源描述:
《高考夯實基礎(chǔ)概率與統(tǒng)計》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、統(tǒng)計簡單隨機(jī)抽樣1.總體和樣本在統(tǒng)計學(xué)中,把研究對象的全體叫做總體.把每個研究對象叫做個體.把總體中個體的總數(shù)叫做總體容量.[來源:Zxxk.Com]為了研究總體的有關(guān)性質(zhì),一般從總體中隨機(jī)抽取一部分:,,,研究,我們稱它為樣本.其中個體的個數(shù)稱為樣本容量.2.簡單隨機(jī)抽樣,也叫純隨機(jī)抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨機(jī)地抽取調(diào)查單位。特點是:每個樣本單位被抽中的可能性相同(概率相等),樣本的每個單位完全獨立,彼此間無一定的關(guān)聯(lián)性和排斥性。簡單隨機(jī)抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體單位之間差異程
2、度較小和數(shù)目較少時,才采用這種方法。3.簡單隨機(jī)抽樣常用的方法:(1)抽簽法;⑵隨機(jī)數(shù)表法;⑶計算機(jī)模擬法;⑷使用統(tǒng)計軟件直接抽取。在簡單隨機(jī)抽樣的樣本容量設(shè)計中,主要考慮:①總體變異情況;②允許誤差范圍;③概率保證程度。4.抽簽法:(1)給調(diào)查對象群體中的每一個對象編號;(2)準(zhǔn)備抽簽的工具,實施抽簽(3)對樣本中的每一個個體進(jìn)行測量或調(diào)查例:請調(diào)查你所在的學(xué)校的學(xué)生做喜歡的體育活動情況。5.隨機(jī)數(shù)表法:例:利用隨機(jī)數(shù)表在所在的班級中抽取10位同學(xué)參加某項活動。系統(tǒng)抽樣1.系統(tǒng)抽樣(等距抽樣或機(jī)械抽樣):把總體的單位進(jìn)行
3、排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機(jī)抽樣的辦法抽取。K(抽樣距離)=N(總體規(guī)模)/n(樣本規(guī)模)前提條件:總體中個體的排列對于研究的變量來說,應(yīng)是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布??梢栽谡{(diào)查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種循環(huán)性規(guī)律,且這種循環(huán)和抽樣距離重合。2.系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更為重要的是,如果有某種與調(diào)查指標(biāo)相關(guān)的輔
4、助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大大提高估計精度。分層抽樣1.分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機(jī)抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:1.先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。2.先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。2.分層抽樣是把異質(zhì)性較強(qiáng)的總
5、體分成一個個同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):(1)以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。(2)以保證各層內(nèi)部同質(zhì)性強(qiáng)、各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。(3)以那些有明顯分層區(qū)分的變量作為分層變量。3.分層的比例問題:(1)按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。(2)不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子
6、總體進(jìn)行專門研究或進(jìn)行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。用樣本的數(shù)字特征估計總體的數(shù)字特征1、本均值:2、.樣本標(biāo)準(zhǔn)差:3.用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機(jī)抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值和標(biāo)準(zhǔn)差,而只是一個估計,但這種估計是合理的,特別是當(dāng)樣本量很大時,它們確實反映了總體的信息。4.
7、(1)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標(biāo)準(zhǔn)差不變(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉淼膋倍(3)一組數(shù)據(jù)中的最大值和最小值對標(biāo)準(zhǔn)差的影響,區(qū)間的應(yīng)用;“去掉一個最高分,去掉一個最低分”中的科學(xué)道理兩個變量的線性相關(guān)1、概念:(1)回歸直線方程(2)回歸系數(shù)2.最小二乘法3.直線回歸方程的應(yīng)用(1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系[來源:Z*xx*k.Com](2)利用回歸方程進(jìn)行預(yù)測;把預(yù)報因子(即自變量x)代入回歸方
8、程對預(yù)報量(即因變量Y)進(jìn)行估計,即可得到個體Y值的容許區(qū)間。(3)利用回歸方程進(jìn)行統(tǒng)計控制規(guī)定Y值的變化,通過控制x的范圍來實現(xiàn)統(tǒng)計控制的目標(biāo)。如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。4.應(yīng)用直線回歸的注意事項(1)做回歸分析要有實際意義;(