正则表达式中的单词边界是什么? - Code

我试图使用正则表达式来匹配空格分隔的数字。我找不到\b(“单词边界”)的精确定义。我假设-12将是一个“整数词”(与\b\-?\d+\b匹配)，但这似乎不起作用。如果能知道方法，我将不胜感激。

[我在Java 1.6中使用Java正则表达式]

例子:

Pattern pattern = Pattern.compile("\\s*\\b\\-?\\d+\\s*");
String plus = " 12 ";
System.out.println(""+pattern.matcher(plus).matches());

String minus = " -12 ";
System.out.println(""+pattern.matcher(minus).matches());

pattern = Pattern.compile("\\s*\\-?\\d+\\s*");
System.out.println(""+pattern.matcher(minus).matches());

这将返回:

true
false
true

当前回答

单词边界可以出现在以下三个位置之一:

如果第一个字符是单词字符，则在字符串的第一个字符之前。如果最后一个字符是单词字符，则在字符串的最后一个字符之后。在字符串中的两个字符之间，其中一个是单词字符，另一个不是单词字符。

单词字符是字母-数字;负号不是。摘自正则表达式教程。

2009-08-24 21:05:57

其他回答

我认为它是最后一个匹配或字符串的开始或结束的边界(即字符跟随)。

2009-08-24 20:55:23

我相信你的问题是由于一个事实-不是一个字字符。因此，单词boundary将在-之后匹配，因此不会捕获它。单词边界匹配字符串中第一个单词字符之前和最后一个单词字符之后，以及在它之前是单词字符或非单词字符，在它之后是相反的任何位置。还要注意，单词边界是零宽度匹配。

一个可能的选择是

(?:(?:^|\s)-?)\d+\b

这将匹配以空格字符和可选破折号开始，并以单词边界结束的任何数字。它还将匹配从字符串开头开始的数字。

2009-08-24 20:59:46

我想解释一下艾伦·摩尔的答案

字边界是一个位置，它前面有一个字字符而后面没有一个字字符，或者后面有一个字字符而前面没有一个字字符。

假设我有一个字符串“This is a cat, and she's awesome”，我想替换所有出现的字母“a”，只要这个字母('a')存在于“一个单词的边界”，

换句话说，“cat”里面的字母a不应该被替换。

所以我将执行regex(在Python中)为

re.sub(r"\ba"，"e"， myString.strip()) //用e替换a

因此,

输入;输出

这是一只猫，她很棒

这是猫的结尾，她很恶心

2019-02-11 11:39:19

参考:精通正则表达式(Jeffrey E.F. Friedl) - O'Reilly

\b等价于(?<!\w)(?=\w)|(?<=\w)(?!\w)

2020-10-17 15:28:00

在大多数正则表达式方言中，单词边界是在\w和\w(非单词字符)之间的位置，或者在字符串的开头或结尾(分别)以单词字符([0-9A-Za-z_])开始或结束的位置。

因此，在字符串“-12”中，它将匹配在1之前或2之后。破折号不是文字字符。

2009-08-24 21:00:23

aliyun