https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools

在上面的站点上编译“process.py”时发生错误。

 python tools/process.py --input_dir data --            operation resize --outp
ut_dir data2/resize
data/0.jpg -> data2/resize/0.png

回溯(最近一次调用):

File "tools/process.py", line 235, in <module>
  main()
File "tools/process.py", line 167, in main
  src = load(src_path)
File "tools/process.py", line 113, in load
  contents = open(path).read()
      File"/home/user/anaconda3/envs/tensorflow_2/lib/python3.5/codecs.py", line 321, in decode
  (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode     byte 0xff in position 0: invalid start byte

错误的原因是什么? Python的版本是3.5.2。


当前回答

使用此解决方案,它将剥离(忽略)字符并返回不包含它们的字符串。只有使用这个,如果你的需要是剥离他们不转换他们。

with open(path, encoding="utf8", errors='ignore') as f:

使用错误=“忽略” 你会丢失一些字符。但如果你不关心他们,因为他们似乎是额外的字符源于一个糟糕的格式和编程的客户端连接到我的套接字服务器。 那么这是一个简单的直接解决方案。 参考

其他回答

您必须使用latin1编码来读取该文件,因为该文件中有一些特殊字符,使用下面的代码片段来读取该文件。

这里的问题是编码类型。当Python不能将数据转换为读取时,它会给出一个错误。

您可以使用latin1或其他编码值。

我建议您尝试并测试为您的数据集找到正确的方法。

我在遇到同样的错误时遇到了这个线程,在做了一些研究后,我可以确认,这是一个错误,当你试图用UTF-8解码UTF-16文件时发生。

在UTF-16中,第一个字符(在UTF-16中是2个字节)是字节顺序标记(Byte Order Mark, BOM),用于解码提示,不作为字符出现在解码后的字符串中。这意味着第一个字节将是FE或FF,第二个字节是另一个。

在我发现真正的答案后,被大量编辑

如果您从串口接收数据,请确保您使用了正确的波特率(和其他配置):使用(utf-8)解码,但错误的配置将生成相同的错误

UnicodeDecodeError: 'utf-8'编解码器无法解码位置0中的0xff字节:无效的开始字节

查看linux上的串口配置:stty -F /dev/ttyUSBX -a

使用ISO-8859-1编码格式解决此问题。

这仅仅意味着选择了错误的编码来读取文件。

在Mac上,使用file -I file.txt查找正确的编码。在Linux操作系统中,请使用file -i file.txt。