虚位以待(AD)
虚位以待(AD)
首页 > 操作系统 > Unix/BSD > Unix文本处理工具之sed

Unix文本处理工具之sed
类别:Unix/BSD   作者:码皇   来源:互联网   点击:

Unix文本处理工具之sed和上文提到的awk一样,sed也是Unix的文本处理工具。sed是Stream Editor(流式编辑器)的缩写,它能够基于模式匹配过滤(所谓过滤就是在文件中找到符合某些条件的行)修改文本(就是对找到的符合
Unix文本处理工具之sed   和上文提到的awk一样,sed也是Unix的文本处理工具。sed是Stream Editor(流式编辑器)的缩写,它能够基于模式匹配过滤(所谓过滤就是在文件中找到符合某些条件的行)修改文本(就是对找到的符合条件的内容进行一些修改操作)。 1、sed命令格式   1.1 sed命令的基本格式   sed命令主要有三种使用形式:   sed ‘编辑指令’ 文件1 文件2 ……:用于将处理后的结果输出 sed -n ‘编辑指令’ 文件1 文件2 ……:用于只输出编辑指令影响的行 sed -i ‘编辑指令’ 文件1 文件2 ……:用于直接在文本文件上修改文本内容(在物理磁盘上修改文件) 1.2 编辑指令 编辑指令主要由两部分组成:前面是逗号隔开的两个地址(或者没有逗号,只有一个地址),代表要处理文本的起始位置到结束位置;后面是要进行的操作类型。格式如下:   [起始地址[,结束地址]]操作类型   如果在一条sed命令中要用到多条编辑指令,那么各个编辑指令之间要用;隔开,也可以将多条编辑指令放在多个单引号中,但是这样的话,要在每个单引号的前面加一个-e。下面是一个简单的例子:   [plain]  $cat sed_test.txt   1 apple a,b,d,f   2 boy alsdjf,apple,kdjf   3 cat 163.2.201.1   4 dog www.google.com   5 eat http://blog.csdn.net/xia7139      $sed -n '2,5p' sed_test.txt    2 boy alsdjf,apple,kdjf   3 cat 163.2.201.1   4 dog www.google.com   5 eat http://blog.csdn.net/xia7139      $sed -n '5p' sed_test.txt    5 eat http://blog.csdn.net/xia7139      $sed -n -e '2p' -e'5p' sed_test.txt    2 boy alsdjf,apple,kdjf   5 eat http://blog.csdn.net/xia7139   1.3 操作类型 sed常用的操作类型如下:   操作 作用 p 打印文本行(print) n 取下一行(next) d 删除(delete) s 字符串替换(substitude) a 追加新的文本(append) 2、例子 下面的例子都是对文提到的文件sed_test.txt的操作:   [plain]  使用正则表达式:   (1)输出从第一个包含kdjf的行到最后一行($代表最后一行)   $sed -n '/kdjf/,$p' sed_test.txt   2 boy alsdjf,appleapple,kdjf   3 cat 163.2.201.1   4 dog www.google.com   5 eat http://blog.csdn.net/xia7139   (2)输出包含单词apple的行   (shell中单词是指一个字符串前后有空格或其它标点符号。正则表达式中用一个<>来界定一个单词,在sed中用该符号要进行转义。)   $sed -n '/<apple>/p' sed_test.txt   1 apple a,b,d,f      删除指定行(这里没有-i,不对原文件进行操作,只是将处理后的结果输出。):   (1)删除第2到4行   $sed '2,4d' sed_test.txt   1 apple a,b,d,f   5 eat http://blog.csdn.net/xia7139   (2)删除包含appleapple的行和最后一行($)   $sed '/appleapple/d;$d' sed_test.txt   1 apple a,b,d,f   3 cat 163.2.201.1   4 dog www.google.com   (3)删除不包含(!表示反选,选中不符合条件的行)apple的行(这样就只剩下了包含apple的行了)   $sed '/apple/!d' sed_test.txt   1 apple a,b,d,f   2 boy alsdjf,appleapple,kdjf      替换指定文本:   (1)将1-4行的apple换成AMAZON。s代表替换,g代表如果一行出现两个apple则全部替换。   $sed '1,4s/apple/AMAZON/g' sed_test.txt   1 AMAZON a,b,d,f   2 boy alsdjf,AMAZONAMAZON,kdjf   3 cat 163.2.201.1   4 dog www.google.com   5 eat http://blog.csdn.net/xia7139   (2)注释shell脚本(在行首插入#)   $sed '1,3s/^/#/g' sed_test.txt   #1 apple a,b,d,f   #2 boy alsdjf,appleapple,kdjf   #3 cat 163.2.201.1   4 dog www.google.com   5 eat http://blog.csdn.net/xia7139   (3)删除字符串apple(如果不写起始地址和结束地址,则默认为所有行。)   $sed 's/apple//g' sed_test.txt   1  a,b,d,f   2 boy alsdjf,,kdjf   3 cat 163.2.201.1   4 dog www.google.com   5 eat http://blog.csdn.net/xia7139   以上两篇文章介绍了Unix两个文本处理工具awk和sed,希望对大家有所帮助。 3、初步体会sed的威力   比如你有一个文件内容如下:   [python]  test.txt:   {'books/daglib/0015113': '<title>Scale-isometric polytopal graphs in hypercubes and Z<sub>n</sub>.</title>n',    'books/daglib/0097705': '<title>Discrete total l<sub>p</sub>-norm approximation problem for the function.</title>n',    'books/daglib/p/AveneauCFM11': '<title>A Framework for <i>n</i>-Dimensional Visibility Computations.</title>n',    'books/daglib/p/Carter11': '<title>Using <i>Dungeons and Dragons</i> to Integrate Curricula in Classroom.</title>n',    'books/daglib/p/CasolaLRV11': '<title>Access Control in Cloud-on-Grid Systems: The <i>PerfCloud</i> Case Study.</title>n',    'books/daglib/p/ChunKZDMZ11': '<title>Reverse Engineer of Gene Networks with Application <i>in silico</i> Network.</title>n',    'books/daglib/p/ChungK11': '<title>eQTL Mapping for Functional Classes of <i>Saccharomyces cerevisiae</i> Genes wssion.</title>n',    'books/daglib/p/Goldman11': '<title>A Model for Computer Graphics Based on Algebra for xe2x84x9d<sup>3</sup>.</title>n',    'books/daglib/p/LiZ11': '<title>Line Geometry over xe2x84x9d<sup>3, 3</sup>, and Stewart Platforms.</title>n',    'books/daglib/p/Liestol11': '<title><i>Situated Simulations</i> Between Reality and Designing a Narrative Space.</title>n'}   现在你要将其中的各行中的类似于标签之类的东西去掉,只需用一条sed命令: [plain]  $sed -e 's/<title>//g;s/</title>//g' -e 's/<i>//g;s/</i>//g' -e 's/<sub>//g;s/</sub>//g' -e 's/<sup>//g;s/</sup>//g' test.txt    {'books/daglib/0015113': 'Scale-isometric polytopal graphs in hypercubes and Zn.n',    'books/daglib/0097705': 'Discrete total lp-norm approximation problem for the function.n',    'books/daglib/p/AveneauCFM11': 'A Framework for n-Dimensional Visibility Computations.n',    'books/daglib/p/Carter11': 'Using Dungeons and Dragons to Integrate Curricula in Classroom.n',    'books/daglib/p/CasolaLRV11': 'Access Control in Cloud-on-Grid Systems: The PerfCloud Case Study.n',    'books/daglib/p/ChunKZDMZ11': 'Reverse Engineer of Gene Networks with Application in silico Network.n',    'books/daglib/p/ChungK11': 'eQTL Mapping for Functional Classes of Saccharomyces cerevisiae Genes wssion.n',    'books/daglib/p/Goldman11': 'A Model for Computer Graphics Based on Algebra for xe2x84x9d3.n',    'books/daglib/p/LiZ11': 'Line Geometry over xe2x84x9d3, 3, and Stewart Platforms.n',    'books/daglib/p/Liestol11': 'Situated Simulations Between Reality and Designing a Narrative Space.n'}   如果要在原文件中修改,只需加-i参数。  
相关热词搜索: Unix 文本 处理