UnicodeDecodeError: 'charmap'编解码器无法解码位置Y中的字节X:字符映射到<undefined>

我试图让一个Python 3程序对一个充满信息的文本文件做一些操作。然而，当我试图读取文件时，我得到以下错误:

Traceback (most recent call last):  
   File "SCRIPT LOCATION", line NUMBER, in <module>  
     text = file.read()
   File "C:\Python31\lib\encodings\cp1252.py", line 23, in decode  
     return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x90 in position 2907500: character maps to `<undefined>`

当前回答

在应用建议的解决方案之前，可以检查文件(以及错误日志)中出现的Unicode字符是什么，在本例中是0x90: https://unicodelookup.com/#0x90/1(或通过搜索0x0090直接访问Unicode Consortium网站http://www.unicode.org/charts/)

然后考虑将其从文件中删除。

2020-08-06 16:05:14

其他回答

不要再浪费你的时间了，只要在读写代码中添加以下encoding="cp437"和errors='ignore'即可:

open('filename.csv', encoding="cp437", errors='ignore')
open(file_name, 'w', newline='', encoding="cp437", errors='ignore')

祝成功

2020-06-01 21:54:36

对于那些在Windows中开发Anaconda的人，我也遇到了同样的问题。notepad++帮我解决它。

在notepad++中打开文件。在右下方，它会告诉你当前的文件编码。在顶部菜单中，在“视图”旁边找到“编码”。在“编码”转到“字符集”，耐心地寻找你需要的编码。在我的例子中，编码“Windows-1252”在“西欧”下找到了

2019-09-01 05:36:10

或者，如果你不需要解码文件，比如将文件上传到网站，可以使用:

open(filename, 'rb')

r =读数，b =二进制

2019-07-08 23:50:46

对我来说，用utf16编码是有效的

file = open('filename.csv', encoding="utf16")

2021-02-21 11:31:22

作为@LennartRegebro回答的延伸:

如果你不知道你的文件使用的是什么编码，上面的解决方案也不起作用(不是utf8)，你发现自己只是在猜测——有一些在线工具可以用来识别那是什么编码。它们并不完美，但通常都能正常工作。在你弄清楚编码之后，你应该能够使用上面的解决方案。

编辑:(摘自评论)

一个非常流行的文本编辑器Sublime text有一个命令来显示编码，如果它已设置…

进入视图->显示控制台(或Ctrl+ ')

在底部view.encoding()输入字段，并希望最好的(我无法得到任何东西，但未定义，但也许你会有更好的运气…)

2016-03-22 16:12:16

UnicodeDecodeError: 'charmap'编解码器无法解码位置Y中的字节X:字符映射到<undefined>

推荐文章

最新文章

标签