bs4。FeatureNotFound:无法找到具有您所请求的功能的树构建器:lxml。是否需要安装解析器库?

...
soup = BeautifulSoup(html, "lxml")
File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__
% ",".join(features))
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?

以上输出在我的终端上。我使用的是Mac OS 10.7.x。我有Python 2.7.1，并遵循本教程获得了Beautiful Soup和lxml，它们都成功安装了，并与位于这里的单独测试文件一起工作。在导致此错误的Python脚本中，我包含了这一行: 导入comparePages 在pageCrawler文件中，我包含了以下两行代码: 从bs4导入BeautifulSoup 从urllib2导入urlopen

任何帮助找出问题是什么以及如何解决都将不胜感激。

当前回答

这个方法对我很有效。我想说的是，我是在虚拟环境中尝试这个方法的。第一:

pip install --upgrade bs4

其次，我使用了:

html.parser

而不是

html5lib

2022-02-27 17:07:34

其他回答

BS4默认情况下需要HTML文档。因此，它将XML文档解析为HTML文档。在构造函数中传递features="xml"作为参数。它解决了我的问题。

2022-07-03 04:41:01

我使用的是Python 3.6，在这篇文章中我有同样的原始错误。在我运行命令后:

python3 -m pip install lxml

它解决了我的问题

2018-01-22 04:48:09

出现错误是因为您使用的解析器。一般来说，如果你有HTML文件/代码，那么你需要使用html5lib(文档可以在这里找到)&如果你有XML文件/数据，那么你需要使用lxml(文档可以在这里找到)。你也可以使用lxml的HTML文件/代码，但有时它会给出一个错误如上所示。因此，最好根据数据/文件的类型明智地选择包。你也可以使用内置模块html_parser。但是，这有时也不起作用。

有关何时使用哪个包的详细信息，您可以在这里查看详细信息

2020-01-24 03:07:16

我更喜欢内置的python html解析器，没有安装没有依赖

soup = BeautifulSoup（s， “html.parser”）

2017-05-10 08:55:25

实际上是其他作品中提到的三个选项。

# 1. 
soup_object= BeautifulSoup(markup,"html.parser") #Python HTML parser

# 2. 
pip install lxml
soup_object= BeautifulSoup(markup,'lxml') # C dependent parser 

# 3.
pip install html5lib
soup_object= BeautifulSoup(markup,'html5lib') # C dependent parser

2020-09-01 20:14:37

bs4。FeatureNotFound:无法找到具有您所请求的功能的树构建器:lxml。是否需要安装解析器库?

推荐文章

最新文章

标签