bs4。FeatureNotFound:无法找到具有您所请求的功能的树构建器:lxml。是否需要安装解析器库?

...
soup = BeautifulSoup(html, "lxml")
File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__
% ",".join(features))
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?

以上输出在我的终端上。我使用的是Mac OS 10.7.x。我有Python 2.7.1，并遵循本教程获得了Beautiful Soup和lxml，它们都成功安装了，并与位于这里的单独测试文件一起工作。在导致此错误的Python脚本中，我包含了这一行: 导入comparePages 在pageCrawler文件中，我包含了以下两行代码: 从bs4导入BeautifulSoup 从urllib2导入urlopen

任何帮助找出问题是什么以及如何解决都将不胜感激。

当前回答

尽管BeautifulSoup默认支持HTML解析器如果您想使用任何其他第三方Python解析器，则需要安装该外部解析器，如(lxml)。

soup_object= BeautifulSoup(markup, "html.parser") #Python HTML parser

但是如果你没有指定任何解析器作为参数，你会得到一个没有指定解析器的警告。

soup_object= BeautifulSoup(markup) #Warnning

要使用任何其他外部解析器，您需要安装它，然后需要指定它。就像

pip install lxml

soup_object= BeautifulSoup(markup, 'lxml') # C dependent parser

外部解析器依赖于c和python，这可能有一些优点和缺点。

2018-03-24 11:06:12

其他回答

我更喜欢内置的python html解析器，没有安装没有依赖

soup = BeautifulSoup（s， “html.parser”）

2017-05-10 08:55:25

我也遇到过同样的问题。我发现原因是我有一个稍微过时的python 6包。

>>> import html5lib
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python2.7/site-packages/html5lib/__init__.py", line 16, in <module>
    from .html5parser import HTMLParser, parse, parseFragment
  File "/usr/local/lib/python2.7/site-packages/html5lib/html5parser.py", line 2, in <module>
    from six import with_metaclass, viewkeys, PY3
ImportError: cannot import name viewkeys

升级你的六个软件包将解决这个问题:

sudo pip install six=1.10.0

2017-03-04 06:17:33

如果你安装了多个版本的Python，你可能需要仔细检查你使用的解释器是否正确。

一旦我选择了正确的Python版本，就找到了lxml。

2022-07-30 23:21:58

pip安装lxml，然后将xml保存在soup = BeautifulSoup(URL， "xml")在Mac上完成了这项工作。

2022-12-29 20:41:52

对于安装了bs4的基本开箱即用的python，您可以使用

soup = BeautifulSoup(html, "html5lib")

如果你想使用formatter='xml'，那么你需要

pip3 install lxml

soup = BeautifulSoup(html, features="xml")

2017-02-10 04:24:46

bs4。FeatureNotFound:无法找到具有您所请求的功能的树构建器:lxml。是否需要安装解析器库?

推荐文章

最新文章

标签