我有一个字符串,里面有两个单引号,'字符。在单引号之间是我想要的数据。
我怎么能写一个正则表达式提取“我想要的数据”从下面的文本?
mydata = "some string with 'the data i want' inside";
我有一个字符串,里面有两个单引号,'字符。在单引号之间是我想要的数据。
我怎么能写一个正则表达式提取“我想要的数据”从下面的文本?
mydata = "some string with 'the data i want' inside";
当前回答
因为你还勾选了Scala,这是一个没有regex的解决方案,可以轻松处理多个带引号的字符串:
val text = "some string with 'the data i want' inside 'and even more data'"
text.split("'").zipWithIndex.filter(_._2 % 2 != 0).map(_._1)
res: Array[java.lang.String] = Array(the data i want, and even more data)
其他回答
String dataIWant = mydata.replaceFirst(".*'(.*?)'.*", "$1");
在javascript中:
mydata.match(/'([^']+)'/)[1]
实际的regexp是:/'([^']+)'/
如果你使用非贪婪修饰符(另一篇文章),它是这样的:
mydata.match(/'(.*?)'/)[1]
它更干净。
这里有一个简单的语句:
String target = myData.replaceAll("[^']*(?:'(.*?)')?.*", "$1");
通过将匹配组设置为可选,还可以通过在这种情况下返回空白来满足找不到引号的需求。
见现场演示。
假设你想要单引号之间的部分,使用一个Matcher正则表达式:
"'(.*?)'"
例子:
String mydata = "some string with 'the data i want' inside";
Pattern pattern = Pattern.compile("'(.*?)'");
Matcher matcher = pattern.matcher(mydata);
if (matcher.find())
{
System.out.println(matcher.group(1));
}
结果:
the data i want
在Scala中,
val ticks = "'([^']*)'".r
ticks findFirstIn mydata match {
case Some(ticks(inside)) => println(inside)
case _ => println("nothing")
}
for (ticks(inside) <- ticks findAllIn mydata) println(inside) // multiple matches
val Some(ticks(inside)) = ticks findFirstIn mydata // may throw exception
val ticks = ".*'([^']*)'.*".r
val ticks(inside) = mydata // safe, shorter, only gets the first set of ticks