https://github.com/affinelayer/pix2pix-tensorflow/tree/master/tools

在上面的站点上编译“process.py”时发生错误。

 python tools/process.py --input_dir data --            operation resize --outp
ut_dir data2/resize
data/0.jpg -> data2/resize/0.png

回溯(最近一次调用):

File "tools/process.py", line 235, in <module>
  main()
File "tools/process.py", line 167, in main
  src = load(src_path)
File "tools/process.py", line 113, in load
  contents = open(path).read()
      File"/home/user/anaconda3/envs/tensorflow_2/lib/python3.5/codecs.py", line 321, in decode
  (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode     byte 0xff in position 0: invalid start byte

错误的原因是什么? Python的版本是3.5.2。


当前回答

我在处理从Linux生成的文件时遇到了同样的问题。事实证明,这与包含问号的文件有关。

其他回答

我有一个类似的问题,并在互联网上搜索这个问题

如果你有这个问题,只需复制你的HTML代码在一个新的HTML文件,并使用正常的<meta charset="UTF-8"> 它将工作....

只需在相同的位置创建一个新的HTML文件,并使用不同的名称

这是由于读取文件时使用了不同的编码方法。在python中,它是默认的 使用unicode编码数据。但是,它在不同的平台上可能并不适用。

我提出了一种编码方法,可以帮助您解决这个问题,如果'utf-8'不工作。

with open(path, newline='', encoding='cp1252') as csvfile:
    reader = csv.reader(csvfile)

如果你改变这里的编码方法,它应该可以工作。此外,如果上面不适合你,你可以在这里找到其他的编码方法——标准编码。

我在尝试使用pandas.read_csv()读取“.csv”文件时遇到了这个UnicodeDecodeError。在我的例子中,我无法使用其他编码器类型来克服这个问题。但是我们不用

pd.read_csv(filename, delimiter=';')

我使用:

pd.read_csv(open(filename, 'r'), delimiter=';')

这对我来说还行。

注意:在open()函数中,使用'r'而不是'rb'。因为'rb'返回的bytes对象首先导致了这个解码器错误,这与read_csv()中的问题相同。但是'r'返回str,这是需要的,因为我们的数据是.csv格式的,并且使用默认的encoding='utf-8'参数,我们可以使用read_csv()函数轻松地解析数据。

我也遇到过类似的问题。

解决方法:

import io

with io.open(filename, 'r', encoding='utf-8') as fn:
  lines = fn.readlines()

然而,我遇到了另一个问题。一些html文件(在我的情况下)不是utf-8,所以我收到了类似的错误。当我排除这些html文件时,一切都很顺利。

所以,除了修复代码,还要检查你正在读取的文件,也许确实存在不兼容性。

我在处理从Linux生成的文件时遇到了同样的问题。事实证明,这与包含问号的文件有关。