在awk中使用多个分隔符

我有一个文件，其中包含以下行:

/logs/tc0001/tomcat/tomcat7.1/conf/catalina.properties:app.env.server.name = demo.example.com
/logs/tc0001/tomcat/tomcat7.2/conf/catalina.properties:app.env.server.name = quest.example.com
/logs/tc0001/tomcat/tomcat7.5/conf/catalina.properties:app.env.server.name = www.example.com

在上面的输出中，我想提取3个字段(数字2,4和最后一个*.example.com)。我得到以下输出:

cat file | awk -F'/' '{print $3 "\t" $5}'
tc0001   tomcat7.1
tc0001   tomcat7.2
tc0001   tomcat7.5

我如何也提取域名后的最后一个字段'='?我如何使用多个分隔符提取字段?

当前回答

对于任何数字2到5或字母a或#或空格的字段分隔符，其中分隔字符必须至少重复2次，不超过6次，例如:

awk -F'[2-5a# ]{2,6}' ...

我确信使用()和参数存在这种变化

2015-03-22 13:50:26

其他回答

使用Raku(以前称为Perl_6)

raku -ne '.split(/ <[/=]> /).[2,4,7].put;'

样例输入:

/logs/tc0001/tomcat/tomcat7.1/conf/catalina.properties:app.env.server.name = demo.example.com
/logs/tc0001/tomcat/tomcat7.2/conf/catalina.properties:app.env.server.name = quest.example.com
/logs/tc0001/tomcat/tomcat7.5/conf/catalina.properties:app.env.server.name = www.example.com

样例输出:

tc0001 tomcat7.1  demo.example.com
tc0001 tomcat7.2  quest.example.com
tc0001 tomcat7.5  www.example.com

上面是一个用Raku编写的解决方案，Raku是perl编程语言家族的一个成员。简单地说，在read中按行输入-ne(按行，非自动打印)命令行标志。行在正则表达式上被分割，正则表达式由一个自定义字符类(/=)组成，使用<[]>操作符创建。然后放入元素[2,4,7]得到上述结果。

当然，上面是一个“基本的”实现，Raku是一种perl家族语言，因此可以应用TMTOWTDI。因此，行可以用|“OR”操作符分隔的文字字符进行分割。在split例程中添加:skip-empty副词可以收紧元素编号(在Perl和Raku中都是零索引)。空格可以从每个元素中删除(使用map)，所需的元素(现在是[1,3,6])与\t制表符连接，给出以下结果:

raku -ne '.split(/ "/" | "=" /, :skip-empty).map(*.trim).[1,3,6].join("\t").put;' file
tc0001  tomcat7.1   demo.example.com
tc0001  tomcat7.2   quest.example.com
tc0001  tomcat7.5   www.example.com

https://raku.org

2021-11-23 19:06:55

对于任何数字2到5或字母a或#或空格的字段分隔符，其中分隔字符必须至少重复2次，不超过6次，例如:

awk -F'[2-5a# ]{2,6}' ...

我确信使用()和参数存在这种变化

2015-03-22 13:50:26

分隔符可以是正则表达式。

awk -F'[/=]' '{print $3 "\t" $5 "\t" $8}' file

生产:

tc0001   tomcat7.1    demo.example.com  
tc0001   tomcat7.2    quest.example.com  
tc0001   tomcat7.5    www.example.com

2012-08-30 19:47:35

另一种方法是使用-F选项，但将其传递给regex以打印左右括号()之间的文本。

文件内容:

528(smbw)
529(smbt)
530(smbn)
10115(smbs)

命令:

awk -F"[()]" '{print $2}' filename

结果:

smbw
smbt
smbn
smbs

使用awk打印[]之间的文本:

使用awk - f[][]但awk - f '[[]] '不会工作。

http://stanlo45.blogspot.com/2020/06/awk-multiple-field-separators.html

2020-06-18 09:09:08

如果你的空格是一致的，你可以使用它作为分隔符，也不是直接插入\t，你可以设置输出分隔符，它将自动包含:

< file awk -v OFS='\t' -v FS='[/ ]' '{print $3, $5, $NF}'

2012-08-30 19:51:09

在awk中使用多个分隔符

推荐文章

最新文章

标签