如何使用sed删除文本文件中包含特定字符串的所有行?
当前回答
cat filename | grep -v "pattern" > filename.1
mv filename.1 filename
其他回答
我用一个包含大约345000行的文件制作了一个小型基准测试。在这种情况下,使用grep的方法似乎比sed方法快15倍左右。
我已经尝试了使用和不使用设置LC_ALL=C,这似乎不会显著改变定时。搜索字符串(CDGA_00004.pdbqt.gz.tar)位于文件的中间位置。
以下是命令和计时:
time sed -i "/CDGA_00004.pdbqt.gz.tar/d" /tmp/input.txt
real 0m0.711s
user 0m0.179s
sys 0m0.530s
time perl -ni -e 'print unless /CDGA_00004.pdbqt.gz.tar/' /tmp/input.txt
real 0m0.105s
user 0m0.088s
sys 0m0.016s
time (grep -v CDGA_00004.pdbqt.gz.tar /tmp/input.txt > /tmp/input.tmp; mv /tmp/input.tmp /tmp/input.txt )
real 0m0.046s
user 0m0.014s
sys 0m0.019s
除了sed之外,还有许多其他方法可以删除具有特定字符串的行:
AWK
awk '!/pattern/' file > temp && mv temp file
红宝石(1.9+)
ruby -i.bak -ne 'print if not /test/' file
Perl
perl -ni.bak -e "print unless /pattern/" file
Shell(bash 3.2及更高版本)
while read -r line
do
[[ ! $line =~ pattern ]] && echo "$line"
done <file > o
mv o file
GNU grep
grep -v "pattern" file > temp && mv temp file
当然,sed(打印相反内容比实际删除更快):
sed -n '/pattern/!p' file
奇怪的是,公认的答案实际上并没有直接回答这个问题。这个问题问的是如何使用sed替换字符串,但答案似乎预设了如何将任意字符串转换为正则表达式的知识。
许多编程语言库具有执行这种转换的功能,例如。
python: re.escape(STRING)
ruby: Regexp.escape(STRING)
java: Pattern.quote(STRING)
但是如何在命令行上执行呢?
由于这是一个面向sed的问题,一种方法是使用sed本身:
sed 's/\([\[/({.*+^$?]\)/\\\1/g'
因此,给定一个任意字符串$string,我们可以编写如下内容:
re=$(sed 's/\([\[({.*+^$?]\)/\\\1/g' <<< "$STRING")
sed "/$re/d" FILE
或作为一个衬垫:
sed "/$(sed 's/\([\[/({.*+^$?]\)/\\\1/g' <<< "$STRING")/d"
其变化如本页其他地方所述。
要删除该行并将输出打印为标准输出,请执行以下操作:
sed '/pattern to match/d' ./infile
要直接修改文件,请执行以下操作:
sed -i '/pattern to match/d' ./infile
相同,但对于BSD sed(Mac OS X和FreeBSD)-不适用于GNU sed:
sed -i '' '/pattern to match/d' ./infile
要直接修改文件(并创建备份),请使用BSD和GNU sed:
sed -i.bak '/pattern to match/d' ./infile
perl -i -nle'/regexp/||print' file1 file2 file3
perl -i.bk -nle'/regexp/||print' file1 file2 file3
第一个命令在原地(-i)编辑文件。
第二个命令执行相同的操作,但通过在文件名中添加.bk来保留原始文件的副本或备份(.bk可以更改为任何内容)。