在Python中删除字符串中的特定字符

我试图使用Python从字符串中删除特定字符。这是我现在使用的代码。不幸的是，它似乎对字符串没有做任何事情。

for char in line:
    if char in " ?.!/;:":
        line.replace(char,'')

我如何正确地做到这一点?

当前回答

递归分割: s =字符串;Chars =要删除的字符

def strip(s,chars):
if len(s)==1:
    return "" if s in chars else s
return strip(s[0:int(len(s)/2)],chars) +  strip(s[int(len(s)/2):len(s)],chars)

例子:

print(strip("Hello!","lo"))    #He!

2018-01-13 14:16:57

其他回答

在Python 3.5中

例如,

os.rename(file_name, file_name.translate({ord(c): None for c in '0123456789'}))

从字符串中删除所有数字

2017-01-07 01:25:05

#!/usr/bin/python
import re

strs = "how^ much for{} the maple syrup? $20.99? That's[] ricidulous!!!"
print strs
nstr = re.sub(r'[?|$|.|!|a|b]',r' ',strs)#i have taken special character to remove but any #character can be added here
print nstr
nestr = re.sub(r'[^a-zA-Z0-9 ]',r'',nstr)#for removing special character
print nestr

2014-05-25 09:34:51

Python中的字符串是不可变的(不能更改)。因此，line.replace(…)的作用只是创建一个新字符串，而不是更改旧字符串。您需要将其重新绑定(赋值)到行，以便使该变量具有新的值，并删除那些字符。

而且，你做的方法相对来说会比较慢。对于有经验的python编程者来说，这也可能会有点困惑，他们会看到一个双嵌套结构，并认为正在发生更复杂的事情。

从Python 2.6和更新的Python 2开始。x版本*，你可以使用str.translate，(见下面的Python 3答案):

line = line.translate(None, '!@#$')

或者用re.sub替换正则表达式

import re
line = re.sub('[!@#$]', '', line)

括号内的字符构成一个字符类。行中属于该类的任何字符都被替换为要sub的第二个参数:空字符串。

Python 3答案

在Python 3中，字符串是Unicode。你得翻译得有点不同。Kevpie在其中一个答案的注释中提到了这一点，str.translate的文档中也提到了这一点。

在调用Unicode字符串的translate方法时，不能传递上面使用的第二个参数。也不能将None作为第一个参数。相反，您传递一个翻译表(通常是字典)作为唯一的参数。这个表将字符的序号值(即对它们调用ord的结果)映射到应该替换它们的字符的序号值，或者对我们来说有用的是none，表示它们应该被删除。

因此，要对Unicode字符串执行上述操作，您可以调用类似于

translation_table = dict.fromkeys(map(ord, '!@#$'), None)
unicode_line = unicode_line.translate(translation_table)

这里使用dict.fromkeys和map简洁地生成包含

{ord('!'): None, ord('@'): None, ...}

甚至更简单，正如另一个答案所说，在适当的地方创建翻译表:

unicode_line = unicode_line.translate({ord(c): None for c in '!@#$'})

或者，正如Joseph Lee提出的那样，使用str.maketrans创建相同的翻译表:

unicode_line = unicode_line.translate(str.maketrans('', '', '!@#$'))

*为了与早期的python兼容，你可以创建一个“null”转换表来代替None:

import string
line = line.translate(string.maketrans('', ''), '!@#$')

这里的字符串。Maketrans用于创建一个转换表，它只是一个包含序数为0到255的字符的字符串。

2010-10-15 03:50:38

令我惊讶的是，还没有人推荐使用内置的过滤功能。

    import operator
    import string # only for the example you could use a custom string

    s = "1212edjaq"

假设我们想过滤掉所有不是数字的东西。使用过滤器内置方法“…等效于生成器表达式(item for item在可迭代if函数(item)中)"[Python 3 Builtins: Filter]

    sList = list(s)
    intsList = list(string.digits)
    obj = filter(lambda x: operator.contains(intsList, x), sList)))

在Python 3中返回

    >>  <filter object @ hex>

要得到打印的字符串，

    nums = "".join(list(obj))
    print(nums)
    >> "1212"

我不确定过滤器在效率方面的排名，但在做列表理解等时，知道如何使用是一件好事。

更新

从逻辑上讲，既然过滤器可以工作，你也可以使用列表理解，从我所读到的，它应该更有效，因为lambdas是编程函数世界的华尔街对冲基金经理。另一个优点是它是一个单行程序，不需要任何导入。例如，使用上面定义的字符串's'，

      num = "".join([i for i in s if i.isdigit()])

就是这样。返回值将是原始字符串中所有数字组成的字符串。

如果你有一个特定的可接受/不可接受字符列表，你只需要调整列表理解的' If '部分。

      target_chars = "".join([i for i in s if i in some_list])

或者,

      target_chars = "".join([i for i in s if i not in some_list])

2017-01-01 06:49:36

试试这个:

def rm_char(original_str, need2rm):
    ''' Remove charecters in "need2rm" from "original_str" '''
    return original_str.translate(str.maketrans('','',need2rm))

这个方法在python3中很有效

2017-10-31 08:01:42

在Python中删除字符串中的特定字符

推荐文章

最新文章

标签