'utf-8' codec不能解码字节0xff在位置0:无效的开始字节

https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools

在上面的站点上编译“process.py”时发生错误。

 python tools/process.py --input_dir data --            operation resize --outp
ut_dir data2/resize
data/0.jpg -> data2/resize/0.png

回溯(最近一次调用):

File "tools/process.py", line 235, in <module>
  main()
File "tools/process.py", line 167, in main
  src = load(src_path)
File "tools/process.py", line 113, in load
  contents = open(path).read()
      File"/home/user/anaconda3/envs/tensorflow_2/lib/python3.5/codecs.py", line 321, in decode
  (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode     byte 0xff in position 0: invalid start byte

错误的原因是什么? Python的版本是3.5.2。

当前回答

您必须使用latin1编码来读取该文件，因为该文件中有一些特殊字符，使用下面的代码片段来读取该文件。

这里的问题是编码类型。当Python不能将数据转换为读取时，它会给出一个错误。

您可以使用latin1或其他编码值。

我建议您尝试并测试为您的数据集找到正确的方法。

2020-08-15 08:07:40

其他回答

我在遇到同样的错误时遇到了这个线程，在做了一些研究后，我可以确认，这是一个错误，当你试图用UTF-8解码UTF-16文件时发生。

在UTF-16中，第一个字符(在UTF-16中是2个字节)是字节顺序标记(Byte Order Mark, BOM)，用于解码提示，不作为字符出现在解码后的字符串中。这意味着第一个字节将是FE或FF，第二个字节是另一个。

在我发现真正的答案后，被大量编辑

2017-12-04 13:01:57

您必须使用latin1编码来读取该文件，因为该文件中有一些特殊字符，使用下面的代码片段来读取该文件。

这里的问题是编码类型。当Python不能将数据转换为读取时，它会给出一个错误。

您可以使用latin1或其他编码值。

我建议您尝试并测试为您的数据集找到正确的方法。

2020-08-15 08:07:40

那些在处理数据帧的Pandas时遇到类似错误的人使用以下解决方案。

示例解决方案。

df = pd.read_csv("File path", encoding='cp1252')

2021-08-23 08:06:05

我有一个类似的问题，并在互联网上搜索这个问题

如果你有这个问题，只需复制你的HTML代码在一个新的HTML文件，并使用正常的<meta charset="UTF-8"> 它将工作....

只需在相同的位置创建一个新的HTML文件，并使用不同的名称

2020-07-30 23:55:35

有一个类似的问题，最后使用UTF-16解码。我的代码如下。

with open(path_to_file,'rb') as f:
    contents = f.read()
contents = contents.rstrip("\n").decode("utf-16")
contents = contents.split("\r\n")

这将把文件内容作为导入，但它将以UTF格式返回代码。从那里开始，它将被解码并以行分隔。

2017-08-16 15:34:43

'utf-8' codec不能解码字节0xff在位置0:无效的开始字节

推荐文章

最新文章

标签