我试图使用grep来匹配包含两个不同字符串的行。我已经尝试了以下方法,但这匹配了包含不是我想要的string1或string2的行。
grep 'string1\|string2' filename
那么我如何匹配与grep只包含两个字符串的行?
我试图使用grep来匹配包含两个不同字符串的行。我已经尝试了以下方法,但这匹配了包含不是我想要的string1或string2的行。
grep 'string1\|string2' filename
那么我如何匹配与grep只包含两个字符串的行?
当前回答
当两个字符串按顺序排列时,在grep命令中放入一个模式:
$ grep -E "string1(?.*)string2" file
例如,在名为Dockerfile的文件中包含以下行:
FROM python:3.8 as build-python
FROM python:3.8-slim
要获取包含字符串的行:FROM python和as build-python,然后使用:
$ grep -E "FROM python:(?.*) as build-python" Dockerfile
然后输出将只显示包含这两个字符串的行:
FROM python:3.8 as build-python
其他回答
发现仅以6个空格开始并以以下内容结束的行:
cat my_file.txt | grep
-e '^ .*(\.c$|\.cpp$|\.h$|\.log$|\.out$)' # .c or .cpp or .h or .log or .out
-e '^ .*[0-9]\{5,9\}$' # numers between 5 and 9 digist
> nolog.txt
我经常遇到和你一样的问题,我刚刚写了一段脚本:
function m() { # m means 'multi pattern grep'
function _usage() {
echo "usage: COMMAND [-inH] -p<pattern1> -p<pattern2> <filename>"
echo "-i : ignore case"
echo "-n : show line number"
echo "-H : show filename"
echo "-h : show header"
echo "-p : specify pattern"
}
declare -a patterns
# it is important to declare OPTIND as local
local ignorecase_flag filename linum header_flag colon result OPTIND
while getopts "iHhnp:" opt; do
case $opt in
i)
ignorecase_flag=true ;;
H)
filename="FILENAME," ;;
n)
linum="NR," ;;
p)
patterns+=( "$OPTARG" ) ;;
h)
header_flag=true ;;
\?)
_usage
return ;;
esac
done
if [[ -n $filename || -n $linum ]]; then
colon="\":\","
fi
shift $(( $OPTIND - 1 ))
if [[ $ignorecase_flag == true ]]; then
for s in "${patterns[@]}"; do
result+=" && s~/${s,,}/"
done
result=${result# && }
result="{s=tolower(\$0)} $result"
else
for s in "${patterns[@]}"; do
result="$result && /$s/"
done
result=${result# && }
fi
result+=" { print "$filename$linum$colon"\$0 }"
if [[ ! -t 0 ]]; then # pipe case
cat - | awk "${result}"
else
for f in "$@"; do
[[ $header_flag == true ]] && echo "########## $f ##########"
awk "${result}" $f
done
fi
}
用法:
echo "a b c" | m -p A
echo "a b c" | m -i -p A # a b c
你可以把它放在。bashrc中。
grep '(string1.*string2 | string2.*string1)' filename
将得到line与string1和string2在任何顺序
假设我们需要在文件testfile中找到多个单词的计数。 有两种方法
1)使用grep命令与regex匹配模式
grep -c '\<\(DOG\|CAT\)\>' testfile
2)使用egrep命令
egrep -c 'DOG|CAT' testfile
使用egrep,您无需担心表达式,只需通过管道分离器分离单词。
ripgrep
下面是使用rg的例子:
rg -N '(?P<p1>.*string1.*)(?P<p2>.*string2.*)' file.txt
它是最快的抓取工具之一,因为它建立在Rust的正则引擎之上,该引擎使用有限自动机、SIMD和积极的文字优化来使搜索非常快。
使用它,特别是在处理大量数据时。
参见GH-875中的相关功能请求。