'utf-8' codec不能解码字节0xff在位置0:无效的开始字节

https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools

在上面的站点上编译“process.py”时发生错误。

 python tools/process.py --input_dir data --            operation resize --outp
ut_dir data2/resize
data/0.jpg -> data2/resize/0.png

回溯(最近一次调用):

File "tools/process.py", line 235, in <module>
  main()
File "tools/process.py", line 167, in main
  src = load(src_path)
File "tools/process.py", line 113, in load
  contents = open(path).read()
      File"/home/user/anaconda3/envs/tensorflow_2/lib/python3.5/codecs.py", line 321, in decode
  (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode     byte 0xff in position 0: invalid start byte

错误的原因是什么? Python的版本是3.5.2。

当前回答

如果可能，在文本编辑器中打开该文件，并尝试将编码更改为UTF-8。否则，在操作系统级别以编程方式进行。

2017-08-13 13:48:27

其他回答

这是由于读取文件时使用了不同的编码方法。在python中，它是默认的使用unicode编码数据。但是，它在不同的平台上可能并不适用。

我提出了一种编码方法，可以帮助您解决这个问题，如果'utf-8'不工作。

with open(path, newline='', encoding='cp1252') as csvfile:
    reader = csv.reader(csvfile)

如果你改变这里的编码方法，它应该可以工作。此外，如果上面不适合你，你可以在这里找到其他的编码方法——标准编码。

2020-09-23 23:09:28

只使用

base64.b64decode(a)

而不是

base64.b64decode(a).decode('utf-8')

2018-06-17 13:34:22

我对PNG文件也有类似的问题。我尝试了以上的解决方案，但都没有成功。这个在python 3.8中对我有用

with open(path, "rb") as f:

2020-11-24 11:22:51

Python尝试将一个字节数组(一个字节，它假设是一个utf-8编码的字符串)转换为unicode字符串(str)。这个过程当然是根据utf-8规则进行解码。当它尝试这样做时，它会遇到一个字节序列，该字节序列在utf-8编码的字符串中是不允许的(即位置0的0xff)。

由于你没有提供任何代码，我们可以看，我们只能猜测剩下的。

从堆栈跟踪中，我们可以假设触发操作是读取文件(contents = open(path).read())。我建议以这样的方式重新编码:

with open(path, 'rb') as f:
  contents = f.read()

open()中模式说明符中的b表示该文件应被视为二进制，因此内容将保持为字节。这种方式不会发生解码尝试。

2017-02-20 09:26:51

我在尝试使用pandas.read_csv()读取“.csv”文件时遇到了这个UnicodeDecodeError。在我的例子中，我无法使用其他编码器类型来克服这个问题。但是我们不用

pd.read_csv(filename, delimiter=';')

我使用:

pd.read_csv(open(filename, 'r'), delimiter=';')

这对我来说还行。

注意:在open()函数中，使用'r'而不是'rb'。因为'rb'返回的bytes对象首先导致了这个解码器错误，这与read_csv()中的问题相同。但是'r'返回str，这是需要的，因为我们的数据是.csv格式的，并且使用默认的encoding='utf-8'参数，我们可以使用read_csv()函数轻松地解析数据。

2021-12-28 08:45:10

'utf-8' codec不能解码字节0xff在位置0:无效的开始字节

推荐文章

最新文章

标签