这是我的代码:


import imaplib
from email.parser import HeaderParser

conn = imaplib.IMAP4_SSL('imap.gmail.com')
conn.login('example@gmail.com', 'password')
conn.select()
conn.search(None, 'ALL')
data = conn.fetch('1', '(BODY[HEADER])')
header_data = data[1][0][1].decode('utf-8')

在这一点上,我得到错误消息:

AttributeError: 'str'对象没有'decode'属性

Python 3不再有str.decode(),所以我如何解决这个问题?


当前回答

在Python 3中,这个心智模型非常直接:

编码是将str对象转换为bytes对象的过程 解码是将bytes对象转换为str对象的过程

┏━━━━━━━┓                ┏━━━━━━━┓
┃       ┃ -> encoding -> ┃       ┃
┃  str  ┃                ┃ bytes ┃
┃       ┃ <- decoding <- ┃       ┃
┗━━━━━━━┛                ┗━━━━━━━┛

在你的例子中,你调用data.decode("UTF-8"),但是变量已经是一个str对象并且已经解码。所以只要直接引用数据,如果字符串是你需要的。

其他回答

我不熟悉这个库,但如果你的问题是你不想要字节数组,一个简单的方法是在强制转换中直接指定编码类型:

>>> my_byte_str
b'Hello World'

>>> str(my_byte_str, 'utf-8')
'Hello World'

这招对我很管用:

html.replace("\\/", "/").encode().decode('unicode_escape', 'surrogatepass')

这类似于json.loads(html)行为

从Python 3开始,所有字符串都是unicode对象。

  a = 'Happy New Year' # Python 3
  b = unicode('Happy New Year') # Python 2

上面的说明是一样的。所以我认为你应该删除.decode('utf-8')部分,因为你已经有了一个unicode对象。

其他答案在某种程度上暗示了这一点,但问题可能出现在期望一个字节对象。在Python 3中,decode在具有bytes类的对象时有效。在解码之前运行encode可能会“修复”问题,但这是一对无用的操作,向上游提示问题。

如果你在PyJWT v2.0.0版本(22/12/2020)之后使用jwt身份验证登陆这里,你可能想要在requirements.txt文件中将你的PyJWT版本冻结到之前的版本。

PyJWT==1.7.1