如何检查字符串是否为unicode或ascii?

我必须在Python中做什么来找出字符串的编码?

当前回答

对于py2/py3兼容性，只需使用

进口六如果isinstance(obj, six.text_type)

2018-05-28 11:56:41

其他回答

在python3中，所有字符串都是Unicode字符的序列。有一种bytes类型保存原始字节。

在python2中，字符串的类型可以是str或unicode。你可以用如下代码来区分:

def whatisthis(s):
    if isinstance(s, str):
        print "ordinary string"
    elif isinstance(s, unicode):
        print "unicode string"
    else:
        print "not a string"

这并不区分“Unicode或ASCII”;它只区分Python类型。Unicode字符串可以由ASCII范围内的纯字符组成，字节字符串可以包含ASCII、编码的Unicode，甚至是非文本数据。

2011-02-13 22:40:50

一种简单的方法是检查unicode是否是内置函数。如果是，你在python2中，你的字符串将是一个字符串。要确保所有内容都使用unicode，可以执行以下操作:

import builtins

i = 'cats'
if 'unicode' in dir(builtins):     # True in python 2, False in 3
  i = unicode(i)

2019-09-18 14:24:38

use:

import six
if isinstance(obj, six.text_type)

在六个库中，它被表示为:

if PY3:
    string_types = str,
else:
    string_types = basestring,

2016-08-08 08:50:49

您可以使用通用编码检测器，但请注意，它只会给您最好的猜测，而不是实际的编码，因为不可能知道字符串“abc”的编码。您将需要在其他地方获取编码信息，例如HTTP协议使用内容类型报头。

2011-02-13 22:34:55

对于py2/py3兼容性，只需使用

进口六如果isinstance(obj, six.text_type)

2018-05-28 11:56:41

如何检查字符串是否为unicode或ascii?

推荐文章

最新文章

标签