bs4。FeatureNotFound:无法找到具有您所请求的功能的树构建器:lxml。是否需要安装解析器库?

...
soup = BeautifulSoup(html, "lxml")
File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__
% ",".join(features))
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?

以上输出在我的终端上。我使用的是Mac OS 10.7.x。我有Python 2.7.1，并遵循本教程获得了Beautiful Soup和lxml，它们都成功安装了，并与位于这里的单独测试文件一起工作。在导致此错误的Python脚本中，我包含了这一行: 导入comparePages 在pageCrawler文件中，我包含了以下两行代码: 从bs4导入BeautifulSoup 从urllib2导入urlopen

任何帮助找出问题是什么以及如何解决都将不胜感激。

当前回答

在一些参考文献中，使用第二个而不是第一个:

soup_object= BeautifulSoup(markup,'html-parser')
soup_object= BeautifulSoup(markup,'html.parser')

2018-04-02 13:28:32

其他回答

在我的例子中，我有一个过时版本的lxml包。所以我更新了它，这就解决了这个问题。

sudo python3 -m pip install lxml --upgrade

2022-02-17 03:25:57

我怀疑这与BS将用于读取HTML的解析器有关。他们的文档在这里，但如果你像我一样(在OSX上)，你可能会被一些需要一些工作的东西困住:

您会注意到，在上面的BS4文档页面中，他们指出BS4默认将使用Python内置HTML解析器。假设你使用的是OSX, Python的apple捆绑版本是2.7.2，它对字符格式化并不宽容。我遇到了同样的问题，所以我升级了我的Python版本来解决它。在virtualenv中这样做可以最大限度地减少对其他项目的干扰。

如果这样做听起来很痛苦，你可以切换到LXML解析器:

pip install lxml

然后试试:

soup = BeautifulSoup(html, "lxml")

根据您的情况，这可能已经足够好了。我觉得这很烦人，所以升级了我的Python版本。使用virtualenv，您可以相当容易地迁移您的包。

2014-11-11 03:16:25

这个方法对我很有效。我想说的是，我是在虚拟环境中尝试这个方法的。第一:

pip install --upgrade bs4

其次，我使用了:

html.parser

而不是

html5lib

2022-02-27 17:07:34

如果你安装了多个版本的Python，你可能需要仔细检查你使用的解释器是否正确。

一旦我选择了正确的Python版本，就找到了lxml。

2022-07-30 23:21:58

在一些参考文献中，使用第二个而不是第一个:

soup_object= BeautifulSoup(markup,'html-parser')
soup_object= BeautifulSoup(markup,'html.parser')

2018-04-02 13:28:32

bs4。FeatureNotFound:无法找到具有您所请求的功能的树构建器:lxml。是否需要安装解析器库?

推荐文章

最新文章

标签