如何使用sed删除文本文件中包含特定字符串的所有行?


当前回答

您可以考虑使用ex(这是一个标准的基于Unix命令的编辑器):

ex +g/match/d -cwq file

哪里:

+执行给定的Ex命令(man-Ex),与执行wq(写入和退出)的-c相同g/match/d-删除具有给定匹配的行的Ex命令,请参见:g的幂

上面的示例是一种符合POSIX的方法,用于根据Unix.SE和POSIX规范中的这篇文章就地编辑文件。


与sed的区别在于:

sed是流编辑器,而不是文件编辑器。AshFAQ

除非您喜欢不可移植的代码、I/O开销和其他一些不良副作用。因此,基本上一些参数(如in-place/-i)是非标准的FreeBSD扩展,可能在其他操作系统上不可用。

其他回答

也可以删除文件中的一系列行。例如,删除SQL文件中的存储过程。

sed'/CREATE PROCEDURE.*/,/END/d'sql行.sql

这将删除CREATE PROCEDURE和END;之间的所有行;。

我用这个sed命令清理了许多sql文件。

我用一个包含大约345000行的文件制作了一个小型基准测试。在这种情况下,使用grep的方法似乎比sed方法快15倍左右。

我已经尝试了使用和不使用设置LC_ALL=C,这似乎不会显著改变定时。搜索字符串(CDGA_00004.pdbqt.gz.tar)位于文件的中间位置。

以下是命令和计时:

time sed -i "/CDGA_00004.pdbqt.gz.tar/d" /tmp/input.txt

real    0m0.711s
user    0m0.179s
sys     0m0.530s

time perl -ni -e 'print unless /CDGA_00004.pdbqt.gz.tar/' /tmp/input.txt

real    0m0.105s
user    0m0.088s
sys     0m0.016s

time (grep -v CDGA_00004.pdbqt.gz.tar /tmp/input.txt > /tmp/input.tmp; mv /tmp/input.tmp /tmp/input.txt )

real    0m0.046s
user    0m0.014s
sys     0m0.019s
perl -i    -nle'/regexp/||print' file1 file2 file3
perl -i.bk -nle'/regexp/||print' file1 file2 file3

第一个命令在原地(-i)编辑文件。

第二个命令执行相同的操作,但通过在文件名中添加.bk来保留原始文件的副本或备份(.bk可以更改为任何内容)。

可以使用sed替换文件中的行。然而,它似乎比使用grep将反转转换为第二个文件,然后将第二个移动到原始文件上要慢得多。

e.g.

sed -i '/pattern/d' filename      

or

grep -v "pattern" filename > filename2; mv filename2 filename

无论如何,第一个命令在我的机器上需要3倍的时间。

SED:

'James \| John/d'-詹姆斯/约翰/!“p”

AWK:

'!/詹姆斯|约翰/'/James | John/{next;}{print}

GREP(语法):

-v“詹姆斯·约翰”