非參數(shù)統(tǒng)計(jì)方法簡介

非參數(shù)統(tǒng)計(jì)方法簡介

ID:37602706

大?。?70.81 KB

頁數(shù):20頁

時(shí)間:2019-05-12

非參數(shù)統(tǒng)計(jì)方法簡介_第1頁
非參數(shù)統(tǒng)計(jì)方法簡介_第2頁
非參數(shù)統(tǒng)計(jì)方法簡介_第3頁
非參數(shù)統(tǒng)計(jì)方法簡介_第4頁
非參數(shù)統(tǒng)計(jì)方法簡介_第5頁
資源描述:

《非參數(shù)統(tǒng)計(jì)方法簡介》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、非參數(shù)統(tǒng)計(jì)方法簡介廖海仁2011.3.17提綱統(tǒng)計(jì)的穩(wěn)健性參數(shù)統(tǒng)計(jì)vs非參數(shù)統(tǒng)計(jì)單總體位置參數(shù)的檢驗(yàn)1)中位數(shù)的符號檢驗(yàn)2)符號秩和檢驗(yàn)分布的一致性檢驗(yàn):χ2檢驗(yàn)兩總體的比較與檢驗(yàn)多總體的比較與檢驗(yàn)統(tǒng)計(jì)之都論壇的一個帖子標(biāo)題:心理統(tǒng)計(jì)求教,方差分析還是T檢驗(yàn)?zāi)???nèi)容:問題是這樣的:對我校4個年級的大學(xué)生適應(yīng)心理進(jìn)行分析,每個年級得出50組數(shù)據(jù),現(xiàn)在要比較不同年級之間適應(yīng)性的差異性,到底要用什么檢驗(yàn),用spss這樣操作呢?小妹在此求教求真理,謝謝各位大哥了~!!回答一:一般與人的行為相關(guān)的數(shù)據(jù)都是偏態(tài)的分布,方差分析和t-test就不適用了吧統(tǒng)計(jì)的

2、穩(wěn)健性指統(tǒng)計(jì)的一種性質(zhì):當(dāng)真實(shí)模型與理論模型有不大的偏離時(shí),統(tǒng)計(jì)方法仍能維持較為良好的性質(zhì),至少不致變得太壞。實(shí)際應(yīng)用中總體的分布的假定的分布常略有偏離;大量的觀測數(shù)據(jù)中常存在部分異常數(shù)據(jù)。(1)對總體分布的穩(wěn)健性若性能與總體的正態(tài)性有較強(qiáng)的依賴關(guān)系者,如F檢驗(yàn),其穩(wěn)健性較差;而與總體均值相關(guān)的統(tǒng)計(jì)方法,如t檢驗(yàn)之類,其穩(wěn)健性相對較好。(2)對異常數(shù)據(jù)的穩(wěn)健性典型例子:樣本均值估計(jì)總體均值,受異常數(shù)據(jù)影響較大,相對中位數(shù)與截?cái)嗑蹈环€(wěn)健。獲得對異常數(shù)據(jù)穩(wěn)健性的途徑:a)設(shè)計(jì)有效的方法發(fā)現(xiàn)并剔除異常值;b)設(shè)計(jì)對個別異常數(shù)據(jù)不敏感的統(tǒng)計(jì)方法參數(shù)統(tǒng)

3、計(jì)vs非參數(shù)統(tǒng)計(jì)參數(shù)統(tǒng)計(jì)假設(shè)總體分布函數(shù)已知(大多數(shù)基于正態(tài)假設(shè))或只帶有一些未知參數(shù)非參數(shù)統(tǒng)計(jì)如果在一個統(tǒng)計(jì)問題中,如果其總體分布不能用有限個實(shí)數(shù)來刻畫,只能對它做一些分布連續(xù)、有密度、具有某些矩等一般性的假定,則稱為非參數(shù)統(tǒng)計(jì)問題。非參數(shù)方法的特點(diǎn)方法的適用面廣而效率可能較低大樣本理論占重要位置所謂大樣本統(tǒng)計(jì)方法是指根據(jù)統(tǒng)計(jì)量的極限性質(zhì)而得出的統(tǒng)計(jì)方法大樣本理論依賴于概率論的極限理論從數(shù)據(jù)本身獲取信息具有良好的穩(wěn)健性基本概念秩(Rank):把樣本X1,X2,…,Xn按大小排列為X(1)<=X(2)<=…<=X(n),若Xi=X(Ri),則稱R

4、i為Xi的秩,全部n個秩構(gòu)成秩統(tǒng)計(jì)量。秩統(tǒng)計(jì)量是非參數(shù)統(tǒng)計(jì)的一個主要工具。《StatisticalMethodsBasedonRank》E.L.Lehmann《OrderStatistics》H.A.David中位數(shù)(Median)?均值(Mean)優(yōu)點(diǎn):(1)有時(shí)比數(shù)學(xué)期望更有代表性;(2)受少數(shù)異常值的影響很?。?)理論上總是存在性質(zhì):設(shè)X有概率密度函數(shù)f(x),另h(a)=E

5、X-a

6、,當(dāng)a為X的中位數(shù)m時(shí),h(a)達(dá)到最小值。缺點(diǎn):(1)X1+X2的中位數(shù)與X1,X2的中位數(shù)缺乏簡單聯(lián)系,數(shù)學(xué)上處理復(fù)雜且不方便(2)中位數(shù)可能不唯一,對于

7、離散型,定義可能不理想(3)實(shí)際計(jì)算的復(fù)雜度遠(yuǎn)大于均值計(jì)算的復(fù)雜度樣本數(shù)據(jù)分析的一般步驟數(shù)據(jù)探查R:plot,hist,boxplot分布的檢驗(yàn)使用QQ圖R:qqnorm,qqlineShapiro-WilkNormalitytest(正態(tài)分布檢驗(yàn))(適合小樣本N<2000)R:shapiro.test(x)Kolmogorov-Smironovtest(K-S分布檢驗(yàn))(適合大樣本)ks.test(x,"pnorm",mean=mean(x),sd=sqrt(var(x)))使用具體的假設(shè)檢驗(yàn)方法:方差分析、T檢驗(yàn)、非參數(shù)方法等中位數(shù)的符號檢驗(yàn)

8、在總體分布為正態(tài)分布時(shí),要檢驗(yàn)其均值是否為μ,使用t檢驗(yàn):T=(X-μ)/(s/sqrt(n))~t(n-1)。當(dāng)分布未知時(shí),此方法可能有風(fēng)險(xiǎn)中位數(shù)檢驗(yàn):檢驗(yàn)其中位數(shù)是否為M0H0:M=M0?H1:M≠M(fèi)0(雙邊假設(shè)檢驗(yàn))符號檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量:S+=#{Xi:Xi-M0>0,i=1,2,3,…,n}將其轉(zhuǎn)化為二項(xiàng)分布檢驗(yàn):S+~binom(n,?)R實(shí)現(xiàn):無直接函數(shù),自己借用binom.test(s,n,p=0.5,…)符號秩和檢驗(yàn)符號檢驗(yàn)不足:不考察值的大小,不能檢驗(yàn)出偏度非常大的分布(實(shí)例中的值明顯偏大于6064,卻沒有檢驗(yàn)出來)。符號秩和檢驗(yàn)

9、(又稱Wilcoxon符號秩檢驗(yàn))基本思想:考察

10、xi-M0

11、的秩,假定總體是連續(xù)的,且對其中位數(shù)是對稱的,則W+=∑Ri(+)服從中點(diǎn)為n(n+1)/4的對稱分布。符號秩和檢驗(yàn)一般比符號檢驗(yàn)更有效(強(qiáng)勢)R:wilcox.test()可用來進(jìn)行符號秩和檢驗(yàn)wilcox.test(x,y=NULL,alternative=c("two.sided","less","greater"),mu=0,paired=FALSE,exact=NULL,correct=TRUE,conf.int=FALSE,conf.level=0.95,...)分布的一致

12、性檢驗(yàn):χ2檢驗(yàn)用來檢驗(yàn)數(shù)據(jù)分布是否與假設(shè)分布是否一致(擬合優(yōu)度檢驗(yàn))H0:X具有分布F?H1:X不具有分布F理論(Pearson定理)

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時(shí)可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。