...
soup = BeautifulSoup(html, "lxml")
File "/Library/Python/2.7/site-packages/bs4/__init__.py", line 152, in __init__
% ",".join(features))
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?

以上输出在我的终端上。我使用的是Mac OS 10.7.x。我有Python 2.7.1,并遵循本教程获得了Beautiful Soup和lxml,它们都成功安装了,并与位于这里的单独测试文件一起工作。在导致此错误的Python脚本中,我包含了这一行: 导入comparePages 在pageCrawler文件中,我包含了以下两行代码: 从bs4导入BeautifulSoup 从urllib2导入urlopen

任何帮助找出问题是什么以及如何解决都将不胜感激。


当前回答

运行这三个命令来确保你已经安装了所有相关的软件包:

pip install bs4
pip install html5lib
pip install lxml

然后,如果需要,重新启动您的Python IDE。

这样就可以解决所有与这个问题有关的问题了。

其他回答

空白参数将导致最佳可用的警告。 soup = BeautifulSoup(html)

---------------/UserWarning:没有显式指定解析器,因此我正在使用此系统的最佳可用HTML解析器(“html5lib”)。这通常不是问题,但如果您在另一个系统或不同的虚拟环境中运行这段代码,它可能使用不同的解析器并表现不同。----------------------/

python 3.7.7

PyCharm 19.3.4 CE

我修复了以下变化

之前更改

soup = BeautifulSoup(r.content, 'html5lib' )
print (soup.prettify())

后改变

soup = BeautifulSoup(r.content, features='html')
print(soup.prettify())

我的代码正常工作

pip安装lxml,然后将xml保存在soup = BeautifulSoup(URL, "xml")在Mac上完成了这项工作。

在python环境中安装LXML解析器。

pip install lxml

你的问题会解决的。你也可以使用内置的python包:

soup = BeautifulSoup(s,  "html.parser")

注意:“HTMLParser”模块已被重命名为“html”。在Python3中

我在pycharm中使用python 3.8。我假设您在开始工作之前没有安装“lxml”。这就是我所做的:


进入“文件->设置” 在左侧设置菜单栏选择“Python解释器”,选择“Python解释器”。 单击包列表上的“+”图标。 搜索“lxml”。 点击“可用软件包”窗口左下方的“安装软件包”。