如何在Python中从字符串中提取数字?

我想提取一个字符串中包含的所有数字。正则表达式和isdigit()方法哪个更适合这个目的?

例子:

line = "hello 12 hi 89"

结果:

[12, 89]

当前回答

如果你只想提取正整数，试试下面的方法:

>>> txt = "h3110 23 cat 444.4 rabbit 11 2 dog"
>>> [int(s) for s in txt.split() if s.isdigit()]
[23, 11, 2]

我认为这比正则表达式示例更好，因为您不需要另一个模块，而且它更具可读性，因为您不需要解析(和学习)正则表达式迷你语言。

这将不识别浮点数、负整数或十六进制格式的整数。如果您不能接受这些限制，下面jmnas的答案可以解决问题。

2010-11-27 01:14:13

其他回答

因为这些都不是我需要找到的excel和word文档中处理真实世界的财务数据，这里是我的变体。它处理整数、浮点数、负数、货币数(因为它在分割时不回复)，并且可以选择删除小数部分而只返回整数，或者返回所有内容。

它还处理印度湖的数字系统，其中逗号出现不规则，而不是每3个数字分开。

它不处理科学符号或预算中括号内的负数——将显示为正数。

它也不提取日期。在字符串中查找日期有更好的方法。

import re
def find_numbers(string, ints=True):            
    numexp = re.compile(r'[-]?\d[\d,]*[\.]?[\d{2}]*') #optional - in front
    numbers = numexp.findall(string)    
    numbers = [x.replace(',','') for x in numbers]
    if ints is True:
        return [int(x.replace(',','').split('.')[0]) for x in numbers]            
    else:
        return numbers

2017-06-02 14:06:13

如果你知道字符串中只有一个数字，比如'hello 12 hi'，你可以尝试filter。

例如:

In [1]: int(''.join(filter(str.isdigit, '200 grams')))
Out[1]: 200
In [2]: int(''.join(filter(str.isdigit, 'Counters: 55')))
Out[2]: 55
In [3]: int(''.join(filter(str.isdigit, 'more than 23 times')))
Out[3]: 23

但是要小心!!：

In [4]: int(''.join(filter(str.isdigit, '200 grams 5')))
Out[4]: 2005

2016-04-05 18:20:43

我一直在寻找一个解决方案来去除字符串的面具，特别是从巴西的电话号码，这篇文章没有回答，但启发了我。这是我的解决方案:

>>> phone_number = '+55(11)8715-9877'
>>> ''.join([n for n in phone_number if n.isdigit()])
'551187159877'

2018-07-12 18:24:59

我很惊讶地发现还没有人提到itertools的用法。Groupby作为实现这一目标的替代方案。

你可以使用itertools.groupby()和str.isdigit()来从字符串中提取数字，如下:

from itertools import groupby
my_str = "hello 12 hi 89"

l = [int(''.join(i)) for is_digit, i in groupby(my_str, str.isdigit) if is_digit]

由l保持的值将是:

[12, 89]

PS:这只是为了说明，作为一种替代方案，我们也可以使用groupby来实现这一点。但这不是一个推荐的解决方案。如果您想实现这一点，您应该使用基于使用str.isdigit作为过滤器的列表理解的fmark的接受答案。

2017-01-16 19:46:17

此答案还包含数字在字符串中为浮点数的情况

def get_first_nbr_from_str(input_str):
    '''
    :param input_str: strings that contains digit and words
    :return: the number extracted from the input_str
    demo:
    'ab324.23.123xyz': 324.23
    '.5abc44': 0.5
    '''
    if not input_str and not isinstance(input_str, str):
        return 0
    out_number = ''
    for ele in input_str:
        if (ele == '.' and '.' not in out_number) or ele.isdigit():
            out_number += ele
        elif out_number:
            break
    return float(out_number)

2016-02-03 09:18:21

如何在Python中从字符串中提取数字?

推荐文章

最新文章

标签