資源描述:
《linux常用文件處理命令介紹》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、文檔級別:普通文件linux常用文件處理命令介紹-20-文檔級別:普通文件目錄linux常用文件處理命令介紹目錄-0-目錄-1-1文件處理命令介紹-2-1.1目的-2-1.2內(nèi)容-2-2命令詳細介紹-2-2.1sort-2-2.2uniq-3-2.3cut-4-2.4paste-4-2.5sed-5-2.6vi-15--20-文檔級別:普通文件修訂紀錄版本號修訂時間內(nèi)容摘要作者1.0.02011-03-01新建李平1文件處理命令介紹1.1目的在日常的開發(fā)中,如果對linux的文件處理的命令比較熟悉,可以大大的提高開發(fā)
2、的效率,舉一個簡單的例子:之前我們有一個這樣的需求,我們從tt中導(dǎo)出了一個很大文件,我們想抽樣調(diào)查看看中間的某些行的數(shù)據(jù)是怎么樣,當時想了一下沒有想到快速的方法。其實方法有很多,比如我們想了解1w行左右的數(shù)據(jù)是什么樣的,我們可以用如下命令:head-10100
3、tail-50其實這個方法并不是唯一的方法,我們還可以用非常強大的sed命令,想知道sed命令如何完成這個需求的嗎?不急??!我們慢慢來。從上面的簡單的需求我們就可以看出掌握linux的文件處理命令對我們?nèi)粘5拈_發(fā)工作的效率的提升是很大的,所以希望通過這次探討能
4、幫助我們在日常的開發(fā)中提高效率。這也是我們這次探討的目的所在。1.2內(nèi)容sort,uniq,cut,paste,sed,vi2命令詳細介紹2.1sortsort命令將許多不同的域按不同的列順序分類(簡單的講就是排序)。1、sort選項sort命令的一般格式為:sort-cmu-ooutput_file[otheroptions]+pos1+pos2input_files下面簡要介紹一下sort的參數(shù):-c測試文件是否已經(jīng)分類。-m合并兩個分類文件。-u刪除所有復(fù)制行。-o存儲sort結(jié)果的輸出文件名。其他選項有:-b
5、使用域進行分類時,忽略第一個空格。-n指定分類是域上的數(shù)字分類。-20-文檔級別:普通文件-t域分隔符;用非空格或tab鍵分隔域。-r對分類次序或比較求逆。+nn為域號。使用此域號開始分類。nn為域號。在分類比較時忽略此域,一般與+n一起使用。2、sort啟動方式缺省情況下,sort認為一個空格或一系列空格為分隔符。要加入其他方式分隔,使用-t選項。sort執(zhí)行時,先查看是否為域分隔設(shè)置了-t選項,如果設(shè)置了,則使用它來將記錄分隔成域0、域1等等;如果未設(shè)置,用空格代替。缺省時sort將整個行排序,指定域號的情況例外
6、。關(guān)于sort的一個重要事實是它參照第一個域作為域0,域1是第二個域,等等。3、文件是否已分類sort-cdata.txt4、sort分類求逆如果要逆向sort結(jié)果,使用-r選項。sort-t:-rvideo.txt5、按指定域分類有時需要只按第2域(分類鍵1)分類。sort-t:+1video.txt6、數(shù)值域分類用-n選項。必須用,不然得不到想要的結(jié)果。sort-t:+3nvideo.txt7、唯一性分類使用-u選項進行唯一性(不重復(fù))分類以去除重復(fù)行。8、使用k的其他sort方法sort還有另外一些方法指定分類
7、鍵??梢灾付╧選項。sort-t:-k4video.txt使用k做分類鍵排序:可以指定分類鍵次序。先以第4域,再以第1域分類,命令為-k4-k1sort-t:-k4-k1video.txt9、指定sort序列可以指定分類鍵順序,也可以使用-n選項指定不使用哪個分類鍵進行查詢。看下面的sort命令:sort+0-2+3該命令意即開始以域0分類,忽略域2,然后再使用域3分類。1.1uniquniq用來從一個文本文件中去除或禁止重復(fù)行。一般uniq假定文件已分類,并且結(jié)果正確。sort的唯一性選項去除所有重復(fù)行,而uniq
8、命令并不這樣做。重復(fù)行是什么?在uniq里意即持續(xù)不斷重復(fù)出現(xiàn)的行,中間不夾雜任何其他文本.命令一般格式:uniq-udc-finputfileoutputfile其選項含義:-u只顯示不重復(fù)行。-20-文檔級別:普通文件-d只顯示有重復(fù)數(shù)據(jù)行,每種重復(fù)行只顯示其中一行-c打印每一重復(fù)行出現(xiàn)次數(shù)。-fn為數(shù)字,前n個域被忽略。一些系統(tǒng)不識別-f選項,這時替代使用-n。對特定域進行測試:使用-n只測試一行一部分的唯一性。例如-5意即測試第5域后各域唯一性。域從1開始記數(shù)。如果忽略第1域,只測試第2域唯一性,使用-n2,
9、下述文件包含一組數(shù)據(jù),其中第2域代表組代碼。uniq-f2parts.txt或uniq-n2parts.txt1.1cutcut用來從標準輸入或文本文件中剪切列或域。剪切文本可以將之粘貼到一個文本文件。cut一般格式為:cut[options]file1file2下面介紹其可用選項:-clist指定剪切字符數(shù)。-ffield指定剪切域數(shù)。-d指