資源描述:
《統(tǒng)計(jì)實(shí)驗(yàn)與SAS上機(jī)簡(jiǎn)易過(guò)程步.doc》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、數(shù)據(jù)統(tǒng)計(jì)分析一般可遵循以下思路:(1)先確定研究目的,根據(jù)研究目的選擇方法。不同研究目的采用的統(tǒng)計(jì)方法不同,常見(jiàn)的研究目的主要有三類(lèi):①差異性研究,即比較組間均數(shù)、率等的差異,可用的方法有t檢驗(yàn)、方差分析、χ2檢驗(yàn)、非參數(shù)檢驗(yàn)等。②相關(guān)性分析,即分析兩個(gè)或多個(gè)變量之間的關(guān)系,可用的方法有相關(guān)分析。③影響性分析,即分析某一結(jié)局發(fā)生的影響因素,可用的方法有線(xiàn)性回歸、logistic回歸、Cox回歸等。(2)明確數(shù)據(jù)類(lèi)型,根據(jù)數(shù)據(jù)類(lèi)型進(jìn)一步確定方法:①定量資料可用的方法有t檢驗(yàn)、方差分析、非參數(shù)檢驗(yàn)、線(xiàn)性相關(guān)、線(xiàn)性回歸等。②分類(lèi)資料可用的方法有χ2檢驗(yàn)、對(duì)數(shù)線(xiàn)性模型、logistic回歸等。下
2、圖簡(jiǎn)要列出了不同研究目的、不同數(shù)據(jù)類(lèi)型常用的統(tǒng)計(jì)分析方法。(3)選定統(tǒng)計(jì)方法后,需要利用統(tǒng)計(jì)軟件具體實(shí)現(xiàn)統(tǒng)計(jì)分析過(guò)程。SAS中,不同的統(tǒng)計(jì)方法對(duì)應(yīng)不同的命令,只要方法選定,便可通過(guò)對(duì)應(yīng)的命令輔之以相應(yīng)的選項(xiàng)實(shí)現(xiàn)統(tǒng)計(jì)結(jié)果的輸出。(4)統(tǒng)計(jì)結(jié)果的輸出并非數(shù)據(jù)分析的完成。一般統(tǒng)計(jì)軟件都會(huì)輸出很多結(jié)果,需要從中選擇自己需要的部分,并做出統(tǒng)計(jì)學(xué)結(jié)論。但統(tǒng)計(jì)學(xué)結(jié)論不同于專(zhuān)業(yè)結(jié)論,最終還需要結(jié)合實(shí)際做出合理的專(zhuān)業(yè)結(jié)論。13/13第一部分:統(tǒng)計(jì)描述1.定量資料的統(tǒng)計(jì)描述指標(biāo)及SAS實(shí)現(xiàn);(1)數(shù)據(jù)分布檢驗(yàn):PROCUNIVARIATE①基本格式:②語(yǔ)句格式示例:1.PROCUNIVARIATEnorma
3、l;/*normal選項(xiàng)表示進(jìn)行正態(tài)性檢驗(yàn)*/2.CLASSgroup;/*指定group為分組變量*/3.VARweight;/*指定分析變量為weight*/4.RUN;③結(jié)果:正態(tài)性檢驗(yàn)(testsfornormality)結(jié)果,常用的是Shapiro-Wilk檢驗(yàn)和Kolmogorov-Smirnov檢驗(yàn)。當(dāng)例數(shù)小于2000時(shí),采用Shapiro-Wilk檢驗(yàn)W值為標(biāo)準(zhǔn);當(dāng)例數(shù)大于2000時(shí),SAS中不顯示Shapiro-Wilk檢驗(yàn)結(jié)果,采用Kolmogorov-Smirnov檢驗(yàn)D值為判斷標(biāo)準(zhǔn)。正態(tài)性檢驗(yàn)的P≤0.05提示不服從正態(tài)分布,P>0.05提示服從正態(tài)分布。注:若服
4、從正態(tài)分布,進(jìn)行PROCMEANS過(guò)程步;若不服從則計(jì)算百分位數(shù),轉(zhuǎn)(3)(2)數(shù)據(jù)描述(符合正態(tài)分布的數(shù)據(jù)):PROCMEANS①基本格式:關(guān)鍵字(可以無(wú)視):不寫(xiě)任何關(guān)鍵字時(shí)默認(rèn)輸出n,mean,std,max,min;n:有效數(shù)據(jù)記錄數(shù)(有效樣本量)median:中位數(shù)mean:均數(shù)qrange:四分位數(shù)間距std:標(biāo)準(zhǔn)差var:方差clm:95%可信區(qū)間max、min:最大、最小值②語(yǔ)句格式示例:1.PROCMEANSnmeanstdmedianqrangeclm;/*關(guān)調(diào)用procmeans過(guò)程,要求輸出的指標(biāo)有例數(shù)、均值、標(biāo)準(zhǔn)差、中位數(shù)、四分位數(shù)間距、95%可信區(qū)間*/2.C
5、LASSgroup;/*指定group為分組變量*/3.VARweight;/*指定分析變量為weight*/4.Run;③結(jié)果以“均數(shù)±標(biāo)準(zhǔn)差”表示(3)偏正態(tài)分布的統(tǒng)計(jì)描述:13/13①基本思想:計(jì)算中位數(shù)和百分位數(shù),并且用“中位數(shù)(Q1~Q3)”表示②語(yǔ)句格式示例:1.procunivariatedata=aa;2.varx;3.outputout=cpctlpre=Ppctlpts=0to100by2.5;/*計(jì)算0到100百分位數(shù),間隔2.5個(gè)百分位數(shù),并將結(jié)果輸出在數(shù)據(jù)集“aa”中*/4.run;5.proctransposedata=cout=d;6.procprintda
6、ta=d;7.run;/*以上是求解百分位數(shù)語(yǔ)句*/1.procunivariatedata=aa2.CIPCTLDF(alpha=0.05);/*求百分位數(shù)的95%可信區(qū)間,(alpha=0.05)此處可缺省;若需求可信區(qū)間,只需指定相應(yīng)的alpha水平*/3.varx;4.run;③結(jié)果:a.偏態(tài)分布的統(tǒng)計(jì)描述以“中位數(shù)(Q1~Q3)”表示b.總體參數(shù)的95%可信區(qū)間1.分類(lèi)(定性)資料的統(tǒng)計(jì)描述指標(biāo)及SAS實(shí)現(xiàn)(1)輸出頻數(shù)表:PROCFREQ①基本格式:②語(yǔ)句格式示例:1.PROCFREQ;2.TABLEgroup*weight;/*table后有g(shù)roup和grade兩個(gè)變量,
7、交叉形成一個(gè)行X列的表格,若group為2類(lèi),grade為3類(lèi),因此形成2X3=6個(gè)格子,每一格子中給出例數(shù)和相應(yīng)比例*/3.RUN;(2)直方圖的繪制①基本語(yǔ)句:histogram變量x②語(yǔ)句格式示例:1.procunivariate;2.varx;3.histogramx/midpoints=163to183by2;/*要求Univariate過(guò)程繪制的直方圖中各直條的組中值為163、165、……183(自行改動(dòng))*/4.run