在Python中做不区分大小写的字符串替换最简单的方法是什么?
字符串类型不支持这一点。你可能最好使用正则表达式子方法和re.IGNORECASE选项。
>>> import re
>>> insensitive_hippo = re.compile(re.escape('hippo'), re.IGNORECASE)
>>> insensitive_hippo.sub('giraffe', 'I want a hIPpo for my birthday')
'I want a giraffe for my birthday'
import re
pattern = re.compile("hello", re.IGNORECASE)
pattern.sub("bye", "hello HeLLo HELLO")
# 'bye bye bye'
这并不需要RegularExp
def ireplace(old, new, text):
"""
Replace case insensitive
Raises ValueError if string not found
"""
index_l = text.lower().index(old.lower())
return text[:index_l] + new + text[index_l + len(old):]
继续bFloch的回答,这个函数将以不区分大小写的方式改变旧与新,而不是一个。
def ireplace(old, new, text):
idx = 0
while idx < len(text):
index_l = text.lower().find(old.lower(), idx)
if index_l == -1:
return text
text = text[:index_l] + new + text[index_l + len(old):]
idx = index_l + len(new)
return text
i='I want a hIPpo for my birthday'
key='hippo'
swp='giraffe'
o=(i.lower().split(key))
c=0
p=0
for w in o:
o[c]=i[p:p+len(w)]
p=p+len(key+w)
c+=1
print(swp.join(o))
在一行中:
import re
re.sub("(?i)hello","bye", "hello HeLLo HELLO") #'bye bye bye'
re.sub("(?i)he\.llo","bye", "he.llo He.LLo HE.LLO") #'bye bye bye'
或者,使用可选的"flags"参数:
import re
re.sub("hello", "bye", "hello HeLLo HELLO", flags=re.I) #'bye bye bye'
re.sub("he\.llo", "bye", "he.llo He.LLo HE.LLO", flags=re.I) #'bye bye bye'
就像布莱尔·康拉德说的那样Replace不支持此功能。
使用正则表达式re.sub,但记得先转义替换字符串。注意,在2.6中re.sub没有标记选项,所以你必须使用嵌入的修饰符'(?i)'(或一个RE-object,参见Blair Conrad的回答)。另外,另一个缺陷是,如果给出了字符串,sub将在替换文本中处理反斜杠转义。为了避免这种情况,可以改为传入lambda。
这是一个函数:
import re
def ireplace(old, repl, text):
return re.sub('(?i)'+re.escape(old), lambda m: repl, text)
>>> ireplace('hippo?', 'giraffe!?', 'You want a hiPPO?')
'You want a giraffe!?'
>>> ireplace(r'[binfolder]', r'C:\Temp\bin', r'[BinFolder]\test.exe')
'C:\\Temp\\bin\\test.exe'
我有\t被转换为转义序列(向下滚动一点),所以我注意到re.sub将反切转义字符转换为转义序列。
为了防止这种情况的发生,我写了以下内容:
替换不区分大小写。
import re
def ireplace(findtxt, replacetxt, data):
return replacetxt.join( re.compile(findtxt, flags=re.I).split(data) )
同样,如果你想用转义字符替换它,就像这里的其他答案一样,将特殊含义的bashslash字符转换为转义序列,只需解码你的find and或replace字符串。在Python 3中,可能必须执行类似.decode("unicode_escape") # python3这样的操作
findtxt = findtxt.decode('string_escape') # python2
replacetxt = replacetxt.decode('string_escape') # python2
data = ireplace(findtxt, replacetxt, data)
在Python 2.7.8中测试
这个函数同时使用str.replace()和re.findall()函数。 它将以不区分大小写的方式将字符串中出现的pattern替换为repl。
def replace_all(pattern, repl, string) -> str:
occurences = re.findall(pattern, string, re.IGNORECASE)
for occurence in occurences:
string = string.replace(occurence, repl)
return string
关于语法细节和选项的有趣观察:
win32上的Python 3.7.2 (tags/v3.7.2:9a3ffc0492, december 23 2018, 23:09:28) [MSC v.1916 64位(AMD64)]
import re
old = "TREEROOT treeroot TREerOot"
re.sub(r'(?i)treeroot', 'grassroot', old)
草根的,草根的
re.sub(r'treeroot', 'grassroot', old)
" TREEROOT grassroot TREEROOT "
re.sub(r'treeroot', 'grassroot', old, flags=re.I)
草根的,草根的
re.sub(r'treeroot', 'grassroot', old, re.I)
" TREEROOT grassroot TREEROOT "
因此,在匹配表达式中添加(?i)前缀或添加“flags=re.”I”作为第四个参数将导致不区分大小写的匹配。 但是,仅使用“re.I”作为第四个参数不会导致不区分大小写的匹配。
相比较而言,
re.findall(r'treeroot', old, re.I)
['TREEROOT', 'TREEROOT', 'TREEROOT']
re.findall(r'treeroot', old)
[“树根”]
推荐文章
- 如何测试一个字符串是否包含列表中的一个子字符串,在熊猫?
- PostgreSQL列名区分大小写吗?
- 'datetime'模块没有'strptime'属性
- 如何将字典保存到文件?
- 如何在Python中绘制网格?
- 如何转换/解析从字符串到字符在java?
- 在Python中元组比较是如何工作的?
- 我如何写好的/正确的包__init__.py文件
- 不能pickle <type 'instancemethod'>当使用多处理Pool.map()
- 在c#中验证字符串只包含字母
- 不区分大小写的替换
- 好的Python模块模糊字符串比较?
- _tkinter。TclError:没有显示名称和没有$ display环境变量
- 在scikit-learn线性回归中找到p值(显著性)
- 如何上传文件与python请求?