从字符串中删除标点符号的最佳方法

这个问题没有太多细节，所以我采取的方法是用最简单的解释来解决这个问题：去掉标点符号。

请注意，所提供的解决方案不考虑收缩词（例如，you are）或连字符词（例如肛门保留）。。。这是关于它们是否应该被视为标点符号的争论。。。也不能解释非英语字符集或类似的东西。。。因为问题中没有提到这些细节。有人认为空格是标点符号，这在技术上是正确的。。。但对我来说，这在当前问题的背景下毫无意义。

# using lambda
''.join(filter(lambda c: c not in string.punctuation, s))

# using list comprehension
''.join('' if c in string.punctuation else c for c in s)

2021-08-13 14:38:15

不一定更简单，但如果你更熟悉re家族的话，就另辟蹊径。

import re, string
s = "string. With. Punctuation?" # Sample string 
out = re.sub('[%s]' % re.escape(string.punctuation), '', s)

2008-11-05 17:39:55

这个问题没有太多细节，所以我采取的方法是用最简单的解释来解决这个问题：去掉标点符号。

请注意，所提供的解决方案不考虑收缩词（例如，you are）或连字符词（例如肛门保留）。。。这是关于它们是否应该被视为标点符号的争论。。。也不能解释非英语字符集或类似的东西。。。因为问题中没有提到这些细节。有人认为空格是标点符号，这在技术上是正确的。。。但对我来说，这在当前问题的背景下毫无意义。

# using lambda
''.join(filter(lambda c: c not in string.punctuation, s))

# using list comprehension
''.join('' if c in string.punctuation else c for c in s)

2021-08-13 14:38:15

我通常用这样的词：

>>> s = "string. With. Punctuation?" # Sample string
>>> import string
>>> for c in string.punctuation:
...     s= s.replace(c,"")
...
>>> s
'string With Punctuation'

2008-11-05 17:41:27

试试那个：）

regex.sub(r'\p{P}','', s)

2020-09-02 07:51:45

我在寻找一个非常简单的解决方案。这是我得到的：

import re 

s = "string. With. Punctuation?" 
s = re.sub(r'[\W\s]', ' ', s)

print(s)
'string  With  Punctuation '

2021-03-26 14:09:10

从字符串中删除标点符号的最佳方法

推荐文章

最新文章

标签