我试图使用python从web获取数据。我导入了urllib。请求包,但在执行时,我得到错误:

certificate verify failed: unable to get local issuer certificate (_ssl.c:1045)

我在Mac OS High Sierra上使用Python 3.7。 我试图从CSV文件: https://s3.amazonaws.com/assets.datacamp.com/production/course_1606/datasets/winequality-red.csv

当我将URL更改为“http”时-我能够获得数据。但是,我认为这避免了检查SSL证书。

所以我在网上找到了一个解决方案: 运行/Applications/Python\ 3.7/Install\ certificates .命令

这解决了我的问题。但是我没有SSL之类的知识。你能帮我理解一下它到底是怎么解决我的问题的吗?

如果可能的话,请给我推荐一些好的资源来了解安全与证书。我是新手。

谢谢!

注意:我确实通过链接openssl, python请求错误:“证书验证失败”

我的问题与链接中的问题不同,因为我想知道当我安装certifi包或运行install \ Certificates.command来修复错误时实际发生了什么。我对证券的理解很差。


当前回答

突然,我开始在windows环境中遇到这个问题。更糟糕的是,当我运行pip时也出现了这个问题,所以问题不是与远程服务器证书有关。

在尝试了许多不同的方法后,我从多个答案中找到了解决方案:

在pip.ini中添加可信主机:pip config set global。“pypi.python.org”(不工作,只传递PIP安装参数) 更新系统证书:pip install pip-system-certs(在安装python- certificate -win32时无效)

现在https请求再次工作\o/

其他回答

我在OSX上遇到了同样的问题,而我的代码在Linux上完全没问题,你在你的问题中给出了答案!

在检查您指向/Applications/Python 3.7/Install certificates .command的文件后,发现该命令将默认Python安装的根证书替换为通过certifi包提供的根证书。

Certifi是根证书的集合。每个SSL证书都依赖于一个信任链:您信任一个特定的证书,因为您信任该证书的父证书,因此您信任该证书的父证书,等等。在某些情况下,没有“父”证书,这些是“根”证书。对于这些问题,除了捆绑普遍信任的根证书(通常是大型信托公司,如eg。“DigiCert”)。

例如,您可以在浏览器安全设置中看到根证书(例如Firefox->首选项->隐私和安全->视图证书->权威)。

回到最初的问题,在运行.command文件之前,在干净的安装上执行这个命令会返回一个空列表:

import os
import ssl                                        
openssl_dir, openssl_cafile = os.path.split(      
    ssl.get_default_verify_paths().openssl_cafile)
# no content in this folder
os.listdir(openssl_dir)
# non existent file
print(os.path.exists(os.path.join(openssl_dir, openssl_cafile)))

这意味着OSX上的Python安装没有默认的证书颁发机构。可能的默认值正是证书包提供的。

在此之后,您只需创建一个具有正确默认值的SSL上下文,如下所示(certificate .where()给出了证书颁发机构的位置):

import platform
# ...

ssl_context = ssl.SSLContext(ssl.PROTOCOL_TLS)
ssl_context.verify_mode = ssl.CERT_REQUIRED
ssl_context.check_hostname = True
ssl_context.load_default_certs()

if platform.system().lower() == 'darwin':
    import certifi
    ssl_context.load_verify_locations(
        cafile=os.path.relpath(certifi.where()),
        capath=None,
        cadata=None)

然后像这样从python请求一个url:

import urllib
# previous context
https_handler = urllib.request.HTTPSHandler(context=ssl_context)

opener = urllib.request.build_opener(https_handler)
ret = opener.open(url, timeout=2)

对于那些仍然想知道如何解决这个问题的人,我通过安装“Install Certificates.command”得到了我的答案。

我是这样做的,

只需双击该文件,等待它安装,在我的情况下,你就准备好了

创建一个从操作系统证书到Python的符号链接对我来说很有效:

ln -s /etc/ssl/* /Library/Frameworks/Python.framework/Versions/3.9/etc/openssl

(我在macOS上,使用pyenv)

由于这个问题没有[macos]标签,我在ubuntu下发布了一个同样问题的解决方案:

sudo apt install ca-certificates
sudo update-ca-certificates --fresh
export SSL_CERT_DIR=/etc/ssl/certs

解决方案来自Github上的Zomatree。

警告:我对证书不是很了解,但我认为这值得尽早检查。

在花时间重新配置代码/包/系统之前,请确保您试图下载的服务器没有问题。

我认为这个错误可能会产生误导,因为“无法获得本地发行者证书”看起来好像是本地机器出了问题,但事实未必如此。

尝试将您正在尝试加载的页面更改为可能不错的页面,例如https://www.google.com,然后查看问题是否仍然存在。此外,使用https://www.digicert.com/help/上的搜索工具检查出问题的域名。

在我的例子中,DigiCert的工具告诉我“证书不是由受信任的权威签署的(根据Mozilla的根存储进行检查)。”这就解释了为什么我似乎已经安装了根证书,但仍然出现错误。当我测试用HTTPS加载一个不同的网站时,我没有遇到任何问题。

如果这种情况适用于你,那么我认为你可能有3个逻辑选项(按优先级排序):1)修复服务器(如果它在你的控制之下),2)禁用证书检查,同时继续使用HTTPS, 3)跳过HTTPS转到HTTP。