我有一个大的HTML文件,有很多标记,看起来像这样:

<p class="MsoNormal" style="margin: 0in 0in 0pt;">
  <span style="font-size: small; font-family: Times New Roman;">stuff here</span>
</p>

我试图做一个Vim搜索和替换,以摆脱所有class=""和style=""但我有麻烦使匹配不贪婪。

我的第一次尝试是这样的

%s/style=".*?"//g

但维姆似乎不喜欢?不幸的是,移除?使匹配过于贪婪。

如何让我的火柴不贪婪?


当前回答

使用\v(在几个评论中建议)

:%s/\v(style|class)\=".{-}"//g

其他回答

怎么了?

%s/style="[^"]*"//g

我发现这类问题的一个很好的解决方法是:

:%!sed ...

(或者perl,如果你喜欢)。低,与其学习vim的正则表达式特性,不如使用您已经知道的工具。使用perl将使?修改器工作,以取消贪婪的匹配。

喂!,

Vim的regexp处理不是很出色。我发现sed的regexp语法与vim的功能非常匹配。

我通常将搜索高亮设置为(:set hlsearch),然后在输入斜杠进入搜索模式后使用regexp。

编辑:Mark,最小化贪婪匹配的技巧在Dale Dougherty的优秀著作《Sed & Awk》中也有介绍。

第三章“理解正则表达式语法”很好地介绍了sed和awk中涉及的更基本的regexp功能。只是一个简短的阅读,强烈推荐。

HTH

欢呼,

使用。\{-}代替。*。

%s/style=“.\{-}”//g

另外,看:帮助非贪婪

vim中的非贪婪搜索是使用{-}操作符完成的。是这样的:

%s/style=".\{-}"//g

试试:

:help non-greedy