在Python中,urllib, urllib2, urllib3和请求模块之间有什么区别?为什么有三个?他们似乎在做同样的事情……
当前回答
在Python 2标准库中,有两个HTTP库是并排存在的。尽管名字相似,但它们并不相关:它们有不同的设计和不同的实现。
urllib是最初的Python HTTP客户端,在Python 1.2中添加到标准库中。urllib的早期文档可以在Python 1.4中找到。 urllib2是一个更强大的HTTP客户端,在Python 1.6中添加,旨在取代urllib: Urllib2——新的和改进的但不兼容的urllib版本(仍处于实验阶段)。 urllib2的早期文档可以在Python 2.1中找到。
Python 3标准库有一个新的urllib,它是旧模块的合并/重构/重写版本。
urllib3是一个第三方包(即不在CPython的标准库中)。尽管有这个名字,但它与标准库包无关,将来也不打算将它包括在标准库中。
最后,请求在内部使用urllib3,但它的目标是更易于使用的API。
其他回答
只是为了补充现有的答案,我没有看到任何人提到python requests不是一个原生库。如果您可以添加依赖项,那么请求就可以了。然而,如果你试图避免添加依赖项,urllib是一个已经可用的原生python库。
我知道已经说过了,但是我强烈推荐requests Python包。
如果您使用过python以外的语言,您可能会认为urllib和urllib2易于使用,代码不多,功能强大,这是我过去的想法。但是请求包非常有用且简短,每个人都应该使用它。
首先,它支持一个完全restful的API,并且非常简单:
import requests
resp = requests.get('http://www.mywebsite.com/user')
resp = requests.post('http://www.mywebsite.com/user')
resp = requests.put('http://www.mywebsite.com/user/put')
resp = requests.delete('http://www.mywebsite.com/user/delete')
不管是否GET / POST,你都不需要再次编码参数,它只是将字典作为参数,并且很好地运行:
userdata = {"firstname": "John", "lastname": "Doe", "password": "jdoe123"}
resp = requests.post('http://www.mywebsite.com/user', data=userdata)
此外,它甚至有一个内置的JSON解码器(再次强调,我知道JSON .loads()不是很多东西要写,但这肯定很方便):
resp.json()
或者如果你的响应数据只是文本,使用:
resp.text
这只是冰山一角。下面是请求站点的功能列表:
国际域名和网址 保持连接和连接池 具有Cookie持久性的会话 浏览器式SSL验证 基本/摘要式身份验证 优雅的键/值cookie 自动减压 Unicode响应体 Multipart File上传 连接超时 . netrc支持 列表项 Python 2.7, 3.6-3.9 线程安全的。
urllib和urllib2都是做URL请求相关工作的Python模块,但提供不同的功能。
1) urllib2可以接受一个Request对象来设置URL请求的头信息,urllib只接受一个URL。
2) urllib提供了用于生成GET查询字符串的urlencode方法,urllib2没有这样的函数。这就是urllib经常与urllib2一起使用的原因之一。
Requests - Requests '是一个用Python编写的简单易用的HTTP库。
1) Python请求会自动对参数进行编码,因此您只需将它们作为简单的参数传递,这与urllib不同,在urllib中,您需要在传递参数之前使用urllib.encode()方法对参数进行编码。
2)自动将应答解码为Unicode。
3)请求也有更方便的错误处理。如果身份验证失败,urllib2将引发urllib2。URLError,而请求将返回一个正常的响应对象,正如预期的那样。你所要做的就是通过布尔响应来判断请求是否成功
我发现上述答案中缺少的一个关键点是urllib返回类型为<class http.client的对象。HTTPResponse>而requests返回<class 'requests.models. response '>. HTTPResponse>。
因此,read()方法可以用于urllib,但不能用于请求。
附注:requests已经有很多方法了,几乎不需要像read();>那样再多一个
您通常应该使用urllib2,因为它通过接受Request对象有时会使事情变得更容易一些,并且还会在协议错误时引发URLException。虽然谷歌应用程序引擎,你不能使用。您必须使用谷歌在其沙箱Python环境中提供的URL获取API。
推荐文章
- 如何在Python中进行热编码?
- 如何嵌入HTML到IPython输出?
- 在Python生成器上使用“send”函数的目的是什么?
- 是否可以将已编译的.pyc文件反编译为.py文件?
- Django模型表单对象的自动创建日期
- 在Python中包装长行
- 如何计算两个时间串之间的时间间隔
- 我如何才能找到一个Python函数的参数的数量?
- 您可以使用生成器函数来做什么?
- 将Python诗歌与Docker集成
- 提取和保存视频帧
- 使用请求包时出现SSL InsecurePlatform错误
- 如何检索Pandas数据帧中的列数?
- except:和except的区别:
- 错误:“字典更新序列元素#0的长度为1;2是必需的”