从技术上讲,任何奇数个反斜杠,如文档中所述。

>>> r'\'
  File "<stdin>", line 1
    r'\'
       ^
SyntaxError: EOL while scanning string literal
>>> r'\\'
'\\\\'
>>> r'\\\'
  File "<stdin>", line 1
    r'\\\'
         ^
SyntaxError: EOL while scanning string literal

解析器似乎只能将原始字符串中的反斜杠视为常规字符(原始字符串不就是这样吗?),但我可能忽略了一些明显的东西。


当前回答

关于python原始字符串的所有误解是,大多数人认为反斜杠(在原始字符串中)只是一个普通字符。事实并非如此。理解这段python教程的关键是:

当有'r'或'r'前缀时,字母a 反斜杠包含在字符串中而不更改,并且所有 反斜杠留在字符串中

所以任何跟在反斜杠后面的字符都是原始字符串的一部分。一旦解析器输入一个原始字符串(非Unicode字符串)并遇到一个反斜杠,它就知道有两个字符(一个反斜杠和后面的一个字符)。

这种方式:

R 'abc\d'由a, b, c, \, d组成 R 'abc 'd'由a, b, c, \, ', d组成 R 'abc\ "由a, b, c, \, '组成

and:

R 'abc\'由a, b, c, \组成,'但现在没有终止引号了。

最后一个案例表明,根据文档,现在一个解析器无法找到结束引号,因为你看到上面的最后一个引号是字符串的一部分,即反斜杠不能在这里最后,因为它将“吞噬”字符串结束字符。

其他回答

为了让你用斜杠结束一个原始字符串,我建议你可以使用这个技巧:

>>> print r"c:\test"'\\'
test\

它使用Python中字符串字面值的隐式连接,并将一个用双引号分隔的字符串与另一个用单引号分隔的字符串连接起来。丑,但有用。

另一位后来删除了他们的答案的用户(不确定他们是否愿意被归功于自己)建议,Python语言设计人员可以使用相同的解析规则,并在事后将转义字符扩展为原始形式(如果文字被标记为原始),从而简化解析器设计。

我认为这是一个有趣的想法,并将其作为社区维基供子孙后代使用。

另一个技巧是使用chr(92),因为它的计算结果是“\”。

我最近不得不清理一串反斜杠,下面的技巧做到了:

CleanString = DirtyString.replace(chr(92),'')

我意识到这并没有考虑到“为什么”,但这条线索吸引了许多人寻找一个即时问题的解决方案。

为什么r'\'是语法不正确的原因是,虽然字符串表达式是原始的,但使用的引号(单引号或双引号)总是必须转义,因为它们将标记引号的结束,否则。因此,如果你想在单引号字符串中表达单引号,除了使用\'没有其他方法。同样适用于双引号。

但是你可以用:

'\\'

关于python原始字符串的所有误解是,大多数人认为反斜杠(在原始字符串中)只是一个普通字符。事实并非如此。理解这段python教程的关键是:

当有'r'或'r'前缀时,字母a 反斜杠包含在字符串中而不更改,并且所有 反斜杠留在字符串中

所以任何跟在反斜杠后面的字符都是原始字符串的一部分。一旦解析器输入一个原始字符串(非Unicode字符串)并遇到一个反斜杠,它就知道有两个字符(一个反斜杠和后面的一个字符)。

这种方式:

R 'abc\d'由a, b, c, \, d组成 R 'abc 'd'由a, b, c, \, ', d组成 R 'abc\ "由a, b, c, \, '组成

and:

R 'abc\'由a, b, c, \组成,'但现在没有终止引号了。

最后一个案例表明,根据文档,现在一个解析器无法找到结束引号,因为你看到上面的最后一个引号是字符串的一部分,即反斜杠不能在这里最后,因为它将“吞噬”字符串结束字符。