資源描述:
《第4講數(shù)據(jù)操作和數(shù)據(jù)管理1》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、第四講數(shù)據(jù)操作和數(shù)據(jù)管理(一)參考書目:(Alsosee)①M(fèi)itchell,M.N.2010.DataManagementUsingStata:APracticalHandbook.CollegeStation,TX:StataPress.?Long,J.S.2009.TheWorkflowofDataAnalysisUsingStata.CollegeStation,TX:StataPress.?Hamilton,L.C.2013.StatisticswithStata:UpdatedforVersion12.8
2、thed.Boston:Brooks/Cole.(中文版見⑤)@Baum,C.F.2009.AnIntroductiontoStataProgramming.CollegeStation,TX:StataPress⑤《應(yīng)用STATA做統(tǒng)計(jì)分析》(勞倫斯?漢密爾頓著,郭志剛等譯,重慶大學(xué)出版社,2011)。⑥《社會(huì)統(tǒng)計(jì)分析與數(shù)據(jù)處理技術(shù):STATA軟件的應(yīng)用》(楊菊華,中國(guó)人民大學(xué)出版社,2008)數(shù)據(jù)分析的第一步首先要求將原始數(shù)據(jù)改造為Stata可用的格式。我們可以將一個(gè)新數(shù)據(jù)通過(guò)以下兒種方式載入Stata:①鍵盤輸
3、入;②讀取原始數(shù)據(jù)的ASCII格式文件;③將電子表格數(shù)據(jù)粘貼到數(shù)據(jù)編輯窗口(Editor)屮;④應(yīng)用第三方數(shù)據(jù)轉(zhuǎn)換程序?qū)⑵渌娮颖砀?、?shù)裾庫(kù)或統(tǒng)計(jì)程序創(chuàng)建的系統(tǒng)數(shù)裾集直接轉(zhuǎn)換過(guò)來(lái)。—旦Stata有了內(nèi)存數(shù)據(jù),我們就可以在Stata中將其存為Stata格式,以利將來(lái)方便地取用和更新。數(shù)據(jù)操作和管理拈如下功能:(1)基本數(shù)據(jù)命令⑵創(chuàng)建和刪除變量⑶函數(shù)和表達(dá)式⑷日期和吋間⑸加載,保存,導(dǎo)入和導(dǎo)出數(shù)據(jù)⑹合并數(shù)據(jù)⑺重塑數(shù)據(jù)集⑻標(biāo)簽,顯示格式和注釋⑼變量的更改和重命名⑽檢合數(shù)據(jù)(11)文件操作?混合數(shù)據(jù)命令當(dāng)數(shù)據(jù)管理任務(wù)很復(fù)雜或
4、需要重復(fù)進(jìn)行吋,Stata用戶可以編寫自己的程序來(lái)自動(dòng)完成這些工作。盡管Stata是因其分析功能而著名,其實(shí)它同時(shí)也具有廣泛的數(shù)據(jù)管理功能。本講將介紹其屮一些基本功能?;緮?shù)據(jù)命令1.[D]useLoadStatadatasetuseLoadStatadataset(打開Stata數(shù)據(jù)集)例h(打幵指定變量,可應(yīng)用條件語(yǔ)句:if/in)uselnwagegradeagetenureraceusingnlsworkdescribe2.[D]saveSaveStatadatasetsaveSaveStatadataset
5、(保存Stata數(shù)拋集)savefilename(首次保存文件)save,replace(保存H.替換已有文件)3.[D]describeDescribedatainmemoryorinfiledescribeDescribedatainmemoryorinfile(描述內(nèi)存或文件中的數(shù)據(jù),生成內(nèi)存數(shù)據(jù)或文件數(shù)據(jù)的概要)注意:第一,變量名保證沒冇歧義的情況下可以使用縮寫,或使用縮寫通配符(?)代替省略部分,例如displ?;第二,可以指定一系列的變量,如變量1-變量n例husestates,cleardescribe
6、,numbers(變量按順序編號(hào),變量名前面加上數(shù)字序號(hào))describe,fullnames(完整變量名)describestateregionmedianmarriagedivorce(變量列表,注意此處用到了縮寫)例2:usecensus,cleardescribepop*(通配符*)describestateregionpop18p(stat或po都是$昔識(shí)的)例3:describeusingstates例4:useauto,cleardescribe(顯樂(lè)報(bào)告,內(nèi)存數(shù)據(jù)米改變)describe,replac
7、e(沒有報(bào)告顯示,內(nèi)存數(shù)據(jù)G改變,生成包含報(bào)告顯示信息的新數(shù)據(jù)集)dlist1.[D]editBrowseoreditdatawithDataEditoreditBrowseoreditdatawithDataEditor(利用數(shù)據(jù)編輯器瀏覽或修改數(shù)據(jù))(可應(yīng)用條件語(yǔ)句:if和in)edit操作匯總:Modes三種模式:1.編輯模式;2.瀏覽橫式;3.過(guò)濾模式(包含條件語(yǔ)句:inrange;ifexp)為變量指定值標(biāo)簽修改己有值增加新變量增加新觀測(cè)值復(fù)制和粘貼工作tl志的改變Thecurrentobservation
8、andcurrentvariable了解當(dāng)前的觀測(cè)值和當(dāng)前變量AssigningvaluelabelstovariablesChangingvaluesofexistingcellsAddingnewvariablesAddingnewobservationsCopyingandpastingLoggingchanges1.[D]listLis