我试图让一个Python 3程序对一个充满信息的文本文件做一些操作。然而,当我试图读取文件时,我得到以下错误:

Traceback (most recent call last):  
   File "SCRIPT LOCATION", line NUMBER, in <module>  
     text = file.read()
   File "C:\Python31\lib\encodings\cp1252.py", line 23, in decode  
     return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x90 in position 2907500: character maps to `<undefined>`  

当前回答

或者,如果你不需要解码文件,比如将文件上传到网站,可以使用:

open(filename, 'rb')

r =读数,b =二进制

其他回答

对我来说,改变Mysql字符编码一样,我的代码有助于整理出解决方案。照片=开放(pic3.png,编码= latin1)中的一个

该文件没有使用CP1252编码。它使用了另一种编码。哪一个你得自己想清楚。常见的是Latin-1和UTF-8。由于在Latin-1中0x90实际上没有任何含义,因此更可能是UTF-8(其中0x90是一个延续字节)。

打开文件时指定编码:

file = open(filename, encoding="utf8")

对我来说,用utf16编码是有效的

file = open('filename.csv', encoding="utf16")

在Python的新版本(从3.7开始)中,您可以添加解释器选项-Xutf8,这应该可以解决您的问题。如果你使用Pycharm,只需运行>编辑配置(在选项卡配置更改值字段解释器选项-Xutf8)。

或者,同样地,您可以将环境变量PYTHONUTF8设置为1。

作为@LennartRegebro回答的延伸:

如果你不知道你的文件使用的是什么编码,上面的解决方案也不起作用(不是utf8),你发现自己只是在猜测——有一些在线工具可以用来识别那是什么编码。它们并不完美,但通常都能正常工作。在你弄清楚编码之后,你应该能够使用上面的解决方案。

编辑:(摘自评论)

一个非常流行的文本编辑器Sublime text有一个命令来显示编码,如果它已设置…

进入视图->显示控制台(或Ctrl+ ')

在底部view.encoding()输入字段,并希望最好的(我无法得到任何东西,但未定义,但也许你会有更好的运气…)