如何使用sed只输出捕获的组?

有没有一种方法告诉sed只输出捕获的组?

例如，给定输入:

This is a sample 123 text and some 987 numbers

和模式:

/([\d]+)/

我能得到只有123和987输出的方式格式化后引用?

当前回答

您可以使用ripgrep，它似乎也是简单替换的sed替代品，就像这样

rg '(\d+)' -or '$1'

由于两次匹配，ripgrep使用-o或——only matching和-r或——replace两次只输出$1的第一个捕获组(引用以避免shell将其解释为变量)。

2021-04-13 04:26:28

其他回答

Sed最多可以记住9个模式，但是您需要使用转义括号来记住正则表达式的部分内容。

请看这里的例子和更多细节

2010-05-06 00:15:13

让它工作的关键是告诉sed排除您不想输出的内容，并指定您想要输出的内容。这个技巧取决于你知道你要找多少匹配。下面的grep命令适用于不指定数量的匹配。

string='This is a sample 123 text and some 987 numbers'
echo "$string" | sed -rn 's/[^[:digit:]]*([[:digit:]]+)[^[:digit:]]+([[:digit:]]+)[^[:digit:]]*/\1 \2/p'

这表示:

不要默认打印每行(-n) 排除零或多个非数字包含一个或多个数字排除一个或多个非数字包含一个或多个数字排除零或多个非数字打印替换(p)(在一行上)

一般来说，在sed中使用括号捕获组，并使用反向引用输出捕获的组:

echo "foobarbaz" | sed 's/^foo\(.*\)baz$/\1/'

将输出“bar”。如果你使用-r (-E用于OS X)扩展正则表达式，你不需要转义括号:

echo "foobarbaz" | sed -r 's/^foo(.*)baz$/\1/'

最多可以有9个捕获组及其反向引用。反向引用按照组出现的顺序编号，但它们可以以任何顺序使用，并且可以重复使用:

echo "foobarbaz" | sed -r 's/^foo(.*)b(.)z$/\2 \1 \2/'

输出“a bar a”。

如果你有GNU grep:

echo "$string" | grep -Po '\d+'

它也可以在BSD中工作，包括OS X:

echo "$string" | grep -Eo '\d+'

这些命令将匹配任意数量的数字序列。输出将在多行上。

或者像这样的变化:

echo "$string" | grep -Po '(?<=\D )(\d+)'

-P选项启用Perl兼容正则表达式。参见man 3 pcrepattern或man 3 pcresyntax。

2010-05-06 02:39:18

我想给出一个关于“仅输出使用sed捕获的组”的简单示例

我有/home/me/myfile-99，并希望输出文件的序列号:99

我的第一次尝试没有成功:

echo "/home/me/myfile-99" | sed -r 's/myfile-(.*)$/\1/'
# output: /home/me/99

为了做到这一点，我们还需要捕获捕获组中不需要的部分:

echo "/home/me/myfile-99" | sed -r 's/^(.*)myfile-(.*)$/\2/'
# output: 99

*)注意sed没有\d

2021-04-30 03:16:24

您可以使用ripgrep，它似乎也是简单替换的sed替代品，就像这样

rg '(\d+)' -or '$1'

由于两次匹配，ripgrep使用-o或——only matching和-r或——replace两次只输出$1的第一个捕获组(引用以避免shell将其解释为变量)。

2021-04-13 04:26:28

你可以使用grep

grep -Eow "[0-9]+" file

2010-05-06 01:11:41

如何使用sed只输出捕获的组?

推荐文章

最新文章

标签