最近,我在安装SciPy时遇到了麻烦,特别是在我正在开发的Heroku应用程序上,我发现了Conda。

使用Conda可以创建环境,这与virtualenv的功能非常相似。我的问题是:

如果我使用Conda,它会取代对virtualenv的需求吗?如果不是,我如何将两者结合使用?我是在Conda中安装virtualenv,还是在virtualenv中安装Conda ? 我还需要使用pip吗?如果是这样,我还能在隔离的环境中安装带有pip的包吗?


当前回答

我在公司工作,在几道防火墙后面的机器上,我没有管理权限

在我有限的python使用经验(2年)中,我遇到过一些库(JayDeBeApi,sasl)在通过pip安装时抛出c++依赖错误 错误:需要Microsoft Visual c++ 14.0。通过“Microsoft Visual c++ Build Tools”获取:http://landinghub.visualstudio.com/visual-cpp-build-tools

这些安装与conda很好,因此,从那些日子起,我开始与conda env合作。 然而,阻止conda在我没有写权限的c.programfiles中安装依赖并不容易。

其他回答

虚拟环境和pip

我要补充的是,使用Anaconda创建和删除conda环境非常简单。

> conda create --name <envname> python=<version> <optional dependencies>

> conda remove --name <envname> --all 

在激活的环境中,通过conda或pip安装包:

(envname)> conda install <package>

(envname)> pip install <package>

这些环境与conda类似pip的包管理紧密相关,因此创建环境并安装Python和非Python包都很简单。


Jupyter

此外,在环境中安装ipykernel会在Jupyter笔记本的Kernels下拉菜单中添加一个新列表,从而将可复制的环境扩展到笔记本。从Anaconda 4.1开始,添加了nbextensions,从而更容易地向笔记本添加扩展。

可靠性

根据我的经验,在安装numpy和pandas等大型库时,conda更快、更可靠。此外,如果希望转移环境的保存状态,可以通过共享或克隆环境来实现。


比较

一个非详尽的,快速查看每个工具的功能:

Feature virtualenv conda
Global n y
Local y n
PyPI y y
Channels n y
Lock File n n
Multi-Python n y

描述

virtualenv creates project-specific, local environments usually in a .venv/ folder per project. In contrast, conda's environments are global and saved in one place. PyPI works with both tools through pip, but conda can add additional channels, which can sometimes install faster. Sadly neither has an official lock file, so reproducing environments has not been solid with either tool. However, both have a mechanism to create a file of pinned packages. Python is needed to install and run virtualenv, but conda already ships with Python. virtualenv creates environments using the same Python version it was installed with. conda allows you to create environments with nearly any Python version.

另请参阅

Virtualenvwrapper:全局virtualenv Pyenv:管理python版本 曼巴:“更快”的康达

根据我的经验,conda非常适合数据科学应用程序,可以作为一个很好的通用环境工具。然而,在软件开发中,使用virtualenv在本地的、短暂的、轻量级的环境中放置可能会很方便。

是的,conda比virtualenv更容易安装,并且基本上取代了后者。

另一个新的选择,也是我目前最喜欢的启动和运行环境的方法是Pipenv

它目前是Python.org官方推荐的Python打包工具

毫无疑问,Conda拥有更好的API。但是,我想谈谈使用conda的缺点,因为conda在其他答案中也有它的荣耀:

解决环境问题——conda环境后面的一个大刺。作为补救措施,建议您不要使用conda-forge通道。但是,由于它是最流行的通道,而且一些包(不仅仅是微不足道的包,甚至是非常重要的包,如pyspark)在conda-forge上独家可用,你很快就会陷入困境。 包装环境是一个问题

还有其他已知的问题。Virtualenv是一个上坡路,但路上很少有墙。另一方面,conda,在我的印象中,偶尔有这些硬墙,你只需要深吸一口气,使用virtualenv

安装Conda将使您能够按照您的意愿创建和删除python环境,从而为您提供与virtualenv相同的功能。

在这两种发行版的情况下,您可以创建一个隔离的文件系统树,在那里您可以按照自己的意愿安装和删除python包(可能是使用pip)。如果您想为不同的用例使用相同库的不同版本,或者您只是想尝试一些发行版,然后在节省磁盘空间后删除它,那么这可能会派上用场。

差异:

许可协议。虽然virtualenv使用的是最自由的MIT许可证,但Conda使用的是3条款BSD许可证。

Conda为您提供了自己的包控制系统。这个包控制系统通常提供流行的非python软件的预编译版本(对于大多数流行的系统),这可以很容易地让一些机器学习包工作。也就是说,你不需要为你的系统编译优化的C/ c++代码。虽然这对我们大多数人来说是一种解脱,但它可能会影响此类库的性能。

与virtualenv不同,Conda至少在Linux系统上复制了一些系统库。这些库可能会不同步,导致程序的行为不一致。

结论:

Conda很棒,应该是您开始学习机器学习时的默认选择。这将为您节省一些处理gcc和大量包的时间。然而,Conda并不能取代virtualenv。它引入了一些可能并不总是需要的额外复杂性。它有不同的许可。您可能希望避免在分布式环境或HPC硬件上使用conda。