正则表达式中的单词边界是什么?

我试图使用正则表达式来匹配空格分隔的数字。我找不到\b(“单词边界”)的精确定义。我假设-12将是一个“整数词”(与\b\-?\d+\b匹配)，但这似乎不起作用。如果能知道方法，我将不胜感激。

[我在Java 1.6中使用Java正则表达式]

例子:

Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");
String plus = " 12 ";
System.out.println(""+pattern.matcher(plus).matches());

String minus = " -12 ";
System.out.println(""+pattern.matcher(minus).matches());

pattern = Pattern.compile("\\s*\\-?\\d+\\s*");
System.out.println(""+pattern.matcher(minus).matches());

这将返回:

true
false
true

当前回答

我在这里讨论了b风格正则表达式的边界。

简而言之，它们是有条件的。它们的行为取决于它们旁边的东西。

# same as using a \b before:
(?(?=\w) (?<!\w)  | (?<!\W) )

# same as using a \b after:
(?(?<=\w) (?!\w)  | (?!\W)  )

有时候这并不是你想要的。详见我的另一个答案。

2010-11-18 13:35:46

其他回答

当您使用\\b(\\w+)+\\b时，这表示与只包含单词字符的单词完全匹配([a- za - z0 -9])

例如，在regex开头设置\\b将接受-12(带空格)，但同样不接受-12(不带空格)

供参考支持我的话:https://docs.oracle.com/javase/tutorial/essential/regex/bounds.html

2017-11-19 16:41:37

我在这里讨论了b风格正则表达式的边界。

简而言之，它们是有条件的。它们的行为取决于它们旁边的东西。

# same as using a \b before:
(?(?=\w) (?<!\w)  | (?<!\W) )

# same as using a \b after:
(?(?<=\w) (?!\w)  | (?!\W)  )

有时候这并不是你想要的。详见我的另一个答案。

2010-11-18 13:35:46

查看关于边界条件的文档:

http://java.sun.com/docs/books/tutorial/essential/regex/bounds.html

看看这个例子:

public static void main(final String[] args)
    {
        String x = "I found the value -12 in my string.";
        System.err.println(Arrays.toString(x.split("\\b-?\\d+\\b")));
    }

当你把它打印出来时，注意输出是这样的:

[我发现值-，在我的字符串。]

这意味着“-”字符不会因为位于单词的边界而被拾取，因为它不被认为是单词字符。看来@brianary比我先下手为强，所以他得到了支持。

2009-08-24 21:03:56

单词边界可以出现在以下三个位置之一:

如果第一个字符是单词字符，则在字符串的第一个字符之前。如果最后一个字符是单词字符，则在字符串的最后一个字符之后。在字符串中的两个字符之间，其中一个是单词字符，另一个不是单词字符。

单词字符是字母-数字;负号不是。摘自正则表达式教程。

2009-08-24 21:05:57

参考:精通正则表达式(Jeffrey E.F. Friedl) - O'Reilly

\b等价于(?<!\w)(?=\w)|(?<=\w)(?!\w)

2020-10-17 15:28:00

正则表达式中的单词边界是什么?

推荐文章

最新文章

标签