UnicodeDecodeError: 'utf8'编解码器无法解码位置0中的字节0xa5:无效的开始字节

我使用Python-2.6 CGI脚本，但在服务器日志中发现这个错误，而做json.dumps()，

Traceback (most recent call last):
  File "/etc/mongodb/server/cgi-bin/getstats.py", line 135, in <module>
    print json.dumps(__getdata())
  File "/usr/lib/python2.7/json/__init__.py", line 231, in dumps
    return _default_encoder.encode(obj)
  File "/usr/lib/python2.7/json/encoder.py", line 201, in encode
    chunks = self.iterencode(o, _one_shot=True)
  File "/usr/lib/python2.7/json/encoder.py", line 264, in iterencode
    return _iterencode(o, 0)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xa5 in position 0: invalid start byte

在这里,

__get data()函数返回字典{}。

在发布这个问题之前，我已经提到了这个问题。

更新

下面一行是伤害JSON编码器，

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) # this is the culprit

我有个临时解决办法

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

但我不确定这是正确的做法。

当前回答

在尝试了上述所有的解决方法之后，如果它仍然抛出相同的错误，您可以尝试将文件导出为CSV(如果已经导出了，可以第二次导出)。特别是在使用scikit learn时，最好将数据集作为CSV文件导入。

我花了好几个小时在一起，而解决办法就这么简单。将文件以CSV格式导出到Anaconda或您的分类器工具安装的目录中并尝试。

2017-03-14 14:37:24

其他回答

在我的情况下，我必须将文件保存为UTF8 BOM，而不是UTF8 UTF8，然后这个错误就消失了。

2020-10-18 11:32:54

简单的解决方案:

import pandas as pd
df = pd.read_csv('file_name.csv', engine='python')

2019-12-19 08:17:12

下面一行是伤害JSON编码器，

now = datetime.datetime.now()
now = datetime.datetime.strftime(now, '%Y-%m-%dT%H:%M:%S.%fZ')
print json.dumps({'current_time': now}) // this is the culprit

我有个临时解决办法

print json.dumps( {'old_time': now.encode('ISO-8859-1').strip() })

将此标记为正确的临时修复(不确定)。

2014-03-19 10:23:35

下面的代码片段对我很有用。

import pandas as pd
df = pd.read_csv(filename, sep = ';', encoding = 'latin1', error_bad_lines=False) #error_bad_lines is avoid single line error

2021-02-19 02:37:31

而不是寻找解码a5 (Yen¥)或96 (en-dash -)的方法，告诉MySQL你的客户端编码为“latin1”，但你想在数据库中使用“utf8”。

详情见UTF-8字符的麻烦;我看到的不是我储存的

2020-02-11 05:22:24

UnicodeDecodeError: 'utf8'编解码器无法解码位置0中的字节0xa5:无效的开始字节

推荐文章

最新文章

标签