資源描述:
《用stata做多個文件的合并.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、用Stata做多個文件的合并在我們寫論文處理數(shù)據(jù)時,通常會遇到我們需要的數(shù)據(jù)從國泰安中下載下來,會因為我們的數(shù)據(jù)超過excel的最大65536行的行數(shù)限制,而被分為兩個或幾個表,這時,我們需要對表進行縱向的合并,需要用到append命令;當我們需要從國泰安中下載的變量的數(shù)據(jù)在不同的板塊,也就造成數(shù)據(jù)會出現(xiàn)在不同的表中,這時,我們需要橫向合并各個表,當數(shù)據(jù)不能一一對應時,是不能通過復制粘貼將數(shù)據(jù)復制到一張表中,這時需要用merge命令。下面通過一些例子進行說明:1、縱向合并比如:我們從國泰安中公司研究系列—CSMAR中國
2、上市公司財務報表數(shù)據(jù)庫—現(xiàn)金流量表中下載2002到2012年的現(xiàn)金流量表,下載下來發(fā)現(xiàn)數(shù)據(jù)因為太多分為了兩個表,這時,我們需要縱向合并這兩個表,先分別將兩個現(xiàn)金流量表讀入到Stata中存為.dta文件,再放到同一文件夾中,最后進行合并。如下:setmoreoffcdC:UsersAdministratorDesktop財務數(shù)據(jù)(國泰安)useC:UsersAdministratorDesktop財務數(shù)據(jù)(國泰安)xjllb改.dta,clear#delimit;appendusingxjllb改1;s
3、ortStkcdAccpersavexjllb合并,replace合并結(jié)果,如圖:數(shù)據(jù)超過了65536,數(shù)據(jù)合并成功。當需要合并的文件比較多時,特別是成千上百時,將文件名一一復制中程序中會比較麻煩,這時我們要用到logout,先將文件全放在一個文件夾中,再將文件名輸出到excel或word中,再將所有文件名復制到程序即可。例子如下:setmoreoffcdC:UsersAdministratorDesktop財務數(shù)據(jù)2002-2012logout,replacesave(myfile)excelword:di
4、ruse2002.dta,clear#delimit;appendusing2003.dta2004.dta2005.dta2006.dta2007.dta2008.dta2009.dta2010.dta2011.dta2012.dta;save社保,replace;logout出的文件名如下:將文件名復制到程序中即可2、橫向合并比如:我們需要2002-2012年利潤表和資產(chǎn)負債表的數(shù)據(jù),先從國泰安中下載2002-2012年利潤表和資產(chǎn)負債表的數(shù)據(jù),數(shù)據(jù)也分別在兩個表中,先縱向合并,存為lrb合并.dta和zcfzb合
5、并.dta,接下來做橫向合并,如下:use"C:UsersAdministratorDesktop財務數(shù)據(jù)(國泰安)lrb合并.dta",clearuse"C:UsersAdministratorDesktop財務數(shù)據(jù)(國泰安)zcfzb合并.dta",clearcd"C:UsersAdministratorDesktop財務數(shù)據(jù)(國泰安)"mergem:nStkcdAccperusing"C:UsersAdministratorDesktop財務數(shù)據(jù)(國泰安)lrb合并.dta"
6、drop_msortStkcdAccpersave合并數(shù)據(jù),replace匹配結(jié)果,如下: