資源描述:
《各種常見(jiàn)隨機(jī)化的SAS實(shí)現(xiàn).doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、各種常見(jiàn)隨機(jī)化的SAS實(shí)現(xiàn)在前兩期的講座中我們介紹了實(shí)驗(yàn)設(shè)計(jì)的三要素與四原則[1],本期將結(jié)合實(shí)例重點(diǎn)闡述實(shí)驗(yàn)設(shè)計(jì)中如何實(shí)現(xiàn)各種常見(jiàn)的隨機(jī)化。隨機(jī)化體現(xiàn)在如下三個(gè)方面[2]:①抽樣隨機(jī):每一個(gè)符合條件的實(shí)驗(yàn)對(duì)象參加實(shí)驗(yàn)的機(jī)會(huì)相同,即總體中每個(gè)個(gè)體有相同的機(jī)會(huì)被抽到進(jìn)入樣本之中。它保證所得到的樣本具有代表性,使實(shí)驗(yàn)結(jié)論具有普遍意義;②分組隨機(jī):每個(gè)實(shí)驗(yàn)對(duì)象分配到不同組(通常為對(duì)照組、不同處理組)的機(jī)會(huì)相同。它保證大量難以控制的非處理因素在對(duì)比組間盡可能均衡一致,以提高各組間的可比性;③實(shí)驗(yàn)順序隨機(jī):
2、每個(gè)受試對(duì)象先后接受處理的機(jī)會(huì)相等,它使實(shí)驗(yàn)順序的影響也達(dá)到均衡。本期主要就如何用SAS實(shí)現(xiàn)隨機(jī)抽樣和隨機(jī)分組進(jìn)行闡述。已知編號(hào)為1-20的20例病人的基本信息見(jiàn)表1。本文將以表1數(shù)據(jù)為例,闡述隨機(jī)化的SAS實(shí)現(xiàn)。表120例病人的基本信息病人編號(hào)12345678910性別FFMFFFMMMM年齡60643757413160645816病人編號(hào)11121314151617181920性別MMFFFFFMFF年齡586323372033394049421.隨機(jī)抽樣目前在SAS/STAT模塊中,有一個(gè)與
3、調(diào)查設(shè)計(jì)有關(guān)的SURVEYSELECT過(guò)程。該過(guò)程可用來(lái)實(shí)現(xiàn)各種隨機(jī)抽樣,包括:?jiǎn)渭冸S機(jī)抽樣、系統(tǒng)隨機(jī)抽樣、分層抽樣、無(wú)限隨機(jī)抽樣(有替換)、序貫隨機(jī)抽樣、以及按規(guī)模大小成比例概率抽樣(PPS)等。1.1簡(jiǎn)單隨機(jī)抽樣的實(shí)現(xiàn)簡(jiǎn)單隨機(jī)抽樣,就是從總體中不加任何分組、劃類、排隊(duì)等,完全隨機(jī)地抽取受試對(duì)象。特點(diǎn)是每個(gè)個(gè)體(樣品)被抽中的概率相等,各樣品之間完全獨(dú)立,彼此間無(wú)一定的關(guān)聯(lián)性和排斥性。簡(jiǎn)單隨機(jī)抽樣是其他各種抽樣形式的基礎(chǔ)。通常只是在總體樣品之間差異程度較小和數(shù)目較少時(shí),采用這種方法。例1:從編號(hào)
4、為1到20的人中用簡(jiǎn)單隨機(jī)化的方法抽取10名作為受試者。用SAS9.1.3實(shí)現(xiàn)簡(jiǎn)單隨機(jī)抽樣的程序如下:dataa;inputidsex$age;cards;1F602F64………20F42;run;odshtml;procsurveyselectdata=amethod=srsn=10out=b;run;procprintdata=b;run;odshtmlclose;程序說(shuō)明:首先,創(chuàng)建SAS數(shù)據(jù)集名為a。然后,調(diào)用SURVEYSELECT過(guò)程進(jìn)行隨機(jī)抽樣,并指定一些抽樣選項(xiàng),其中“data=”
5、指定輸入數(shù)據(jù)集,用于指定抽樣框;“method=”用于指定隨機(jī)抽樣的方法,srs表示單純隨機(jī)抽樣;“n=”用于指定抽樣大?。ù颂幙梢杂谩皉ate=”來(lái)替換,用于指定抽樣率);“out=”用于指定輸出數(shù)據(jù)集,它包含所有被抽到的樣本(可以添加選項(xiàng)“rep=number”來(lái)規(guī)定重復(fù)抽樣的次數(shù),如“rep=2”命令系統(tǒng)同時(shí)抽取2份樣本)。最后用PROCPRINT把輸出數(shù)據(jù)集b在輸出窗口中顯示出來(lái)。命令odshtml和odshtmlclose用于把程序運(yùn)行結(jié)果以網(wǎng)頁(yè)格式保存下來(lái)。輸出結(jié)果如下:Selecti
6、onMethodSimpleRandomSamplingInputDataSetARandomNumberSeedSampleSize10SelectionProbability0.5SamplingWeight2OutputDataSetB以上是本次單純隨機(jī)抽樣的基本信息,抽樣方法是簡(jiǎn)單隨機(jī)抽樣(SimpleRandomSampling)。由于未指定SEED=選項(xiàng)來(lái)規(guī)定初始種子,來(lái)產(chǎn)生隨機(jī)數(shù)字流。系統(tǒng)使用默認(rèn)種子作為初始種子(SEED=),如果將來(lái)想重新抽取與本次完全相同的樣本,可以在抽樣時(shí)指定
7、同一種子。抽取的樣本大小是10。抽樣概率(SelectionProbability)是指樣本被抽中的概率,此處為0.5。對(duì)于無(wú)分層的單純隨機(jī)抽樣,樣本的抽樣概率是一致的。抽樣權(quán)重(SamplingWeight)是抽樣概率的倒數(shù),反映樣本信息量的大小。Obsidsexage15F4126F31310M16411M58512M63613F23715F20816F33919F491020F42以上是PROCPRINT命令顯示的輸出數(shù)據(jù)集,包括所有被抽中的樣本。第二列id顯示了被抽中的病人的編號(hào)。1.2分
8、層隨機(jī)抽樣的實(shí)現(xiàn)分層抽樣,先依據(jù)一種或幾種特征將總體分為若干個(gè)子總體,每個(gè)子總體稱作一個(gè)層,然后從每層中隨機(jī)抽取一個(gè)子樣本,這些子樣本合起來(lái)就是總體的樣本。分層抽樣所得的樣本具有較好的代表性,抽樣誤差較小。例2:將表1中的20例病人以性別為分層因素,抽取10名受試者。用SAS9.1.3實(shí)現(xiàn)分層隨機(jī)抽樣的程序如下:odshtml;procsortdata=a;bysex;stratasex;run;procprintdata=b;run;procsurveyselectdata=am