如何检查Python中的字符串是否是ASCII?

我想检查一个字符串是否是ASCII格式的。

我知道ord()，但是当我尝试ord('é')时，我有TypeError: ord()期望一个字符，但发现长度为2的字符串。我知道这是由我构建Python的方式引起的(如ord()的文档所解释的那样)。

还有别的办法吗?

当前回答

Python中的sting (str-type)是一系列字节。仅仅通过查看字符串无法判断这一系列字节是否代表ascii字符串、像ISO-8859-1这样的8位字符集的字符串，还是用UTF-8或UTF-16或其他编码的字符串。

但是，如果您知道使用的编码，那么您可以将str解码为unicode字符串，然后使用正则表达式(或循环)检查它是否包含您所关心的范围之外的字符。

2008-10-14 07:58:08

其他回答

就像@RogerDahl的回答一样，但是通过否定字符类和使用搜索而不是find_all或match来短路更有效。

>>> import re
>>> re.search('[^\x00-\x7F]', 'Did you catch that \x00?') is not None
False
>>> re.search('[^\x00-\x7F]', 'Did you catch that \xFF?') is not None
True

我想正则表达式对此进行了很好的优化。

2016-10-28 16:30:33

但是，如果您知道使用的编码，那么您可以将str解码为unicode字符串，然后使用正则表达式(或循环)检查它是否包含您所关心的范围之外的字符。

2008-10-14 07:58:08

Python 3.7新增功能(bpo32677)

不再对字符串进行烦人/低效的ascii检查，新的内置str/bytes/bytearray方法- .isascii()将检查字符串是否为ascii。

print("is this ascii?".isascii())
# True

2018-07-02 18:32:22

def is_ascii(s):
    return all(ord(c) < 128 for c in s)

2008-10-13 00:30:43

为了防止代码崩溃，可能需要使用try-except来捕获TypeErrors

>>> ord("¶")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: ord() expected a character, but string of length 2 found

例如

def is_ascii(s):
    try:
        return all(ord(c) < 128 for c in s)
    except TypeError:
        return False

2013-07-07 21:16:00

如何检查Python中的字符串是否是ASCII?

推荐文章

最新文章

标签