是否有一个简单的方法来删除字符串中的多个空格?

假设这个字符串:

The   fox jumped   over    the log.

变成:

The fox jumped over the log.

在不分割和进入列表的情况下，最简单的实现方法(1-2行)是什么?

当前回答

import re
string = re.sub('[ \t\n]+', ' ', 'The     quick brown                \n\n             \t        fox')

这将删除所有的制表符，新行和多个空白与单一空白。

2017-04-18 01:30:26

其他回答

因为@pythonlarry问这里缺少基于生成器的版本

groupby连接很简单。Groupby将对具有相同键的连续元素进行分组。并返回每个组的键对和元素列表。所以当键是空格空格是返回整个组。

from itertools import groupby
def group_join(string):
  return ''.join(' ' if chr==' ' else ''.join(times) for chr,times in groupby(string))

由变体组成的组很简单，但是很慢。现在来看发电机变体。在这里，我们使用了一个迭代器，即字符串，并生成除字符后面的字符外的所有字符。

def generator_join_generator(string):
  last=False
  for c in string:
    if c==' ':
      if not last:
        last=True
        yield ' '
    else:
      last=False
    yield c

def generator_join(string):
  return ''.join(generator_join_generator(string))

所以我用其他的方法测量了时间。

while_replace 0.015868543065153062 re_replace 0.22579886706080288 proper_join 0.40058281796518713 group_join 5.53206754301209 generator_join 1.6673167790286243

Hello和World由64KB的空格分隔

while_replace 2.991308711003512 re_replace 0.08232860406860709 proper_join 6.294375243945979 group_join 2.4320066600339487 generator_join 6.329648651066236

不忘原话

while_replace 0.002160938922315836 re_replace 0.008620491018518806 proper_join 0.005650000995956361 group_join 0.028368217987008393 generator_join 0.009435956948436797

有趣的是，这里几乎空间只有字符串组连接不是那么糟糕计时显示的中位数总是七次，每次一千次。

2020-07-22 18:16:19

Foo是你的字符串:

" ".join(foo.split())

需要注意的是，这将删除“所有空白字符(空格，制表符，换行符，返回，formfeed)”(感谢hhsaffar，见评论)。例如，“这不是一个测试”将有效地以“这是一个测试”结束。

2009-10-09 21:52:56

令人惊讶的是，没有人发布一个简单的函数，它会比所有其他发布的解决方案快得多。是这样的:

def compactSpaces(s):
    os = ""
    for c in s:
        if c != " " or (os and os[-1] != " "):
            os += c 
    return os

2020-03-04 13:32:35

import re
string = re.sub('[ \t\n]+', ' ', 'The     quick brown                \n\n             \t        fox')

这将删除所有的制表符，新行和多个空白与单一空白。

2017-04-18 01:30:26

我尝试过下面的方法，它甚至适用于极端的情况，比如:

str1='          I   live    on    earth           '

' '.join(str1.split())

但如果你更喜欢正则表达式，它可以这样做:

re.sub('\s+', ' ', str1)

尽管必须进行一些预处理以删除尾随和结束空格。

2018-10-19 05:27:13

是否有一个简单的方法来删除字符串中的多个空格?

推荐文章

最新文章

标签