在Python中做不区分大小写的字符串替换最简单的方法是什么?


当前回答

这个函数同时使用str.replace()和re.findall()函数。 它将以不区分大小写的方式将字符串中出现的pattern替换为repl。

def replace_all(pattern, repl, string) -> str:
   occurences = re.findall(pattern, string, re.IGNORECASE)
   for occurence in occurences:
       string = string.replace(occurence, repl)
       return string

其他回答

关于语法细节和选项的有趣观察:

win32上的Python 3.7.2 (tags/v3.7.2:9a3ffc0492, december 23 2018, 23:09:28) [MSC v.1916 64位(AMD64)]

import re
old = "TREEROOT treeroot TREerOot"
re.sub(r'(?i)treeroot', 'grassroot', old)

草根的,草根的

re.sub(r'treeroot', 'grassroot', old)

" TREEROOT grassroot TREEROOT "

re.sub(r'treeroot', 'grassroot', old, flags=re.I)

草根的,草根的

re.sub(r'treeroot', 'grassroot', old, re.I)

" TREEROOT grassroot TREEROOT "

因此,在匹配表达式中添加(?i)前缀或添加“flags=re.”I”作为第四个参数将导致不区分大小写的匹配。 但是,仅使用“re.I”作为第四个参数不会导致不区分大小写的匹配。

相比较而言,

re.findall(r'treeroot', old, re.I)

['TREEROOT', 'TREEROOT', 'TREEROOT']

re.findall(r'treeroot', old)

[“树根”]

我有\t被转换为转义序列(向下滚动一点),所以我注意到re.sub将反切转义字符转换为转义序列。

为了防止这种情况的发生,我写了以下内容:

替换不区分大小写。

import re
    def ireplace(findtxt, replacetxt, data):
        return replacetxt.join(  re.compile(findtxt, flags=re.I).split(data)  )

同样,如果你想用转义字符替换它,就像这里的其他答案一样,将特殊含义的bashslash字符转换为转义序列,只需解码你的find and或replace字符串。在Python 3中,可能必须执行类似.decode("unicode_escape") # python3这样的操作

findtxt = findtxt.decode('string_escape') # python2
replacetxt = replacetxt.decode('string_escape') # python2
data = ireplace(findtxt, replacetxt, data)

在Python 2.7.8中测试

在一行中:

import re
re.sub("(?i)hello","bye", "hello HeLLo HELLO") #'bye bye bye'
re.sub("(?i)he\.llo","bye", "he.llo He.LLo HE.LLO") #'bye bye bye'

或者,使用可选的"flags"参数:

import re
re.sub("hello", "bye", "hello HeLLo HELLO", flags=re.I) #'bye bye bye'
re.sub("he\.llo", "bye", "he.llo He.LLo HE.LLO", flags=re.I) #'bye bye bye'

这并不需要RegularExp

def ireplace(old, new, text):
    """ 
    Replace case insensitive
    Raises ValueError if string not found
    """
    index_l = text.lower().index(old.lower())
    return text[:index_l] + new + text[index_l + len(old):] 

就像布莱尔·康拉德说的那样Replace不支持此功能。

使用正则表达式re.sub,但记得先转义替换字符串。注意,在2.6中re.sub没有标记选项,所以你必须使用嵌入的修饰符'(?i)'(或一个RE-object,参见Blair Conrad的回答)。另外,另一个缺陷是,如果给出了字符串,sub将在替换文本中处理反斜杠转义。为了避免这种情况,可以改为传入lambda。

这是一个函数:

import re
def ireplace(old, repl, text):
    return re.sub('(?i)'+re.escape(old), lambda m: repl, text)

>>> ireplace('hippo?', 'giraffe!?', 'You want a hiPPO?')
'You want a giraffe!?'
>>> ireplace(r'[binfolder]', r'C:\Temp\bin', r'[BinFolder]\test.exe')
'C:\\Temp\\bin\\test.exe'