非贪婪(不情愿)正则匹配sed?

我试图使用sed来清理url行来提取域。

所以从:

http://www.suepearson.co.uk/product/174/71/3816/

我想要:

http://www.suepearson.co.uk/

(不管后面有没有斜杠，都没有关系)

我试过:

 sed 's|\(http:\/\/.*?\/\).*|\1|'

And(转义非贪婪量词)

sed 's|\(http:\/\/.*\?\/\).*|\1|'

但我似乎不能让非贪婪量词(?)工作，所以它总是匹配整个字符串。

当前回答

您还应该考虑没有匹配界限的情况。你是否想输出这一行。如果不匹配，我这里的示例不会输出任何内容。

你需要前缀到第三个/，所以选择两次字符串的任何长度不包含/和后面的/，然后字符串的任何长度不包含/，然后匹配/后面的任何字符串，然后打印选择。这个想法适用于任何单个的char delims。

echo http://www.suepearson.co.uk/product/174/71/3816/ | \
  sed -nr 's,(([^/]*/){2}[^/]*)/.*,\1,p'

使用sed命令，您可以快速删除前缀或delim选择，如:

echo 'aaa @cee: { "foo":" @cee: " }' | \
  sed -r 't x;s/ @cee: /\n/;D;:x'

这比一次吃焦肉快多了。

如果之前匹配成功，跳转到标签。在第一道线/之前加\n。移除到第一个\n。如果添加了\n，则跳转到结束并打印。

如果有开始和结束delim，很容易删除结束delim，直到你到达你想要的第n -2个元素，然后做D技巧，在结束delim后删除，如果不匹配跳转到删除，在开始delim和打印之前删除。这仅在开始/结束分隔成对出现时有效。

echo 'foobar start block #1 end barfoo start block #2 end bazfoo start block #3 end goo start block #4 end faa' | \
  sed -r 't x;s/end//;s/end/\n/;D;:x;s/(end).*/\1/;T y;s/.*(start)/\1/;p;:y;d'

2021-06-11 14:11:55

其他回答

@Daniel H(关于你对andcoz的回答的评论，虽然是很久以前的事了):删除后面的零

s,([[:digit:]]\.[[:digit:]]*[1-9])[0]*$,\1,g

这是关于清楚地定义匹配条件……

2020-07-27 13:34:43

另一种方法，不使用正则表达式，是使用字段/分隔符方法，如

string="http://www.suepearson.co.uk/product/174/71/3816/"
echo $string | awk -F"/" '{print $1,$2,$3}' OFS="/"

2009-07-09 10:59:12

echo "/home/one/two/three/myfile.txt" | sed 's|\(.*\)/.*|\1|'

别麻烦了，我在另一个论坛上看到的:)

2010-12-10 01:20:36

Sed当然有它的位置，但这不是其中之一!

正如迪伊所指出的:用切就可以了。在这种情况下，它要简单得多，也安全得多。下面是一个使用Bash语法从URL中提取各种组件的示例:

url="http://www.suepearson.co.uk/product/174/71/3816/"

protocol=$(echo "$url" | cut -d':' -f1)
host=$(echo "$url" | cut -d'/' -f3)
urlhost=$(echo "$url" | cut -d'/' -f1-3)
urlpath=$(echo "$url" | cut -d'/' -f4-)

给你:

protocol = "http"
host = "www.suepearson.co.uk"
urlhost = "http://www.suepearson.co.uk"
urlpath = "product/174/71/3816/"

正如你所看到的，这是一个更加灵活的方法。

(全部归功于Dee)

2013-08-30 14:41:15

另一个sed版本:

sed 's|/[:alnum:].*||' file.txt

它匹配/后面跟着一个字母数字字符(所以不是另一个正斜杠)以及其余字符，直到行尾。之后，它将什么也没有替换掉。删除它。)

2016-02-02 00:03:00

非贪婪(不情愿)正则匹配sed?

推荐文章

最新文章

标签