我在目录树中寻找字符串foo=在文本文件中。在一个普通的Linux机器上,我有bash shell:

grep -ircl "foo=" *

目录中还有许多匹配“foo=”的二进制文件。由于这些结果不相关并降低了搜索速度,所以我希望grep跳过搜索这些文件(主要是JPEG和PNG图像)。我该怎么做呢?

我知道有——exclude=PATTERN和——include=PATTERN选项,但模式格式是什么?grep的手册页说:

--include=PATTERN     Recurse in directories only searching file matching PATTERN.
--exclude=PATTERN     Recurse in directories skip file matching PATTERN.

搜索grep包括,grep包括排除,grep排除和变体没有找到任何相关的

如果有更好的方法只在某些文件中进行grepping,我完全赞成;移动有问题的文件是行不通的。我不能只搜索某些目录(目录结构很混乱,到处都是东西)。此外,我不能安装任何东西,所以我必须使用常用工具(如grep或建议的find)。


当前回答

如果您只想跳过二进制文件,我建议您查看-I(大写I)选项。它忽略二进制文件。我经常使用以下命令:

grep -rI --exclude-dir="\.svn" "pattern" *

它会递归搜索,忽略二进制文件,并且不会在Subversion隐藏文件夹中查找我想要的任何模式。我在我工作的盒子上用"grepsvn"作为别名。

其他回答

在CentOS 6.6/Grep 2.6.3上,我必须这样使用它:

grep "term" -Hnir --include \*.php --exclude-dir "*excluded_dir*"

注意缺少等号“=”(否则——include,——exclude, include-dir和——exclude-dir将被忽略)

看这个。

grep --exclude="*\.svn*" -rn "foo=" * | grep -v Binary | grep -v tags

Grep 2.5.3引入了——exclude-dir参数,它将以您想要的方式工作。

grep -rI --exclude-dir=\.svn PATTERN .

你也可以设置一个环境变量:GREP_OPTIONS="——exclude-dir=\.svn"

不过我支持安迪投ack,这是最好的。

忽略grep的所有二进制结果

grep -Ri "pattern" * | awk '{if($1 != "Binary") print $0}'

awk部分将过滤掉所有二进制文件foo匹配的行

git grep

使用git grep,它针对性能进行了优化,旨在搜索特定的文件。

默认情况下,它忽略二进制文件,并尊重你的.gitignore。如果你不使用Git结构,你仍然可以通过传递——no-index来使用它。

示例语法:

git grep --no-index "some_pattern"

更多示例请参见:

如何排除某些目录/文件从git grep搜索。 检查文件中是否存在多个字符串或正则表达式