Python模块和Python包之间有什么区别?

另请参阅:“包”和“模块”之间的区别(对于其他语言)


当前回答

这里的其他答案可能仍然有点模糊,所以我希望发布一个更清晰的答案。需要注意的是,问题的标题一开始也有点误导,我认为更好的标题是:“与常规模块相比,包模块有什么特别之处?”。

TL;DR-简短回答:

包也是模块,但它们是其中的一种特殊类型。特别之处在于1。它们是“目录”和2。它们可能包含特殊文件,如__init__.py和__main__.py。

更好地理解-更长的答案:

重点是,包是一种特殊类型的模块,因此我们需要首先从总体上了解模块,然后包模块的特殊之处也会有意义。(注意:我有时会在这个答案中将“包模块”称为“包”,反之亦然)

因此,让我们先从总体上讨论模块,因为它不那么模糊/更容易理解。我们对模块做的基本上有两件事,要么在其他模块中导入它们,要么直接用Python执行它们。

导入模块有一个明显的目标,即访问模块内部的内容。

然而,执行模块通常追求以下两个目标之一:

该模块是一个主模块,执行它将启动我们的程序(或其子程序之一)。我们希望单独尝试该模块的功能,即无需先导入。

让我们通过一些示例来了解所有这些:

导入模块:

# bar.py

def talk():
    print("bar")
# foo.py

import bar # <-- importing module "bar"

bar.talk() # <-- prints "bar"

执行模块

目标1,将模块作为主要模块执行:

让我们假设上面示例中的foo.py模块是启动程序的主模块。我们可以通过在终端中键入以下命令来运行它:python3foo.py#<--执行一个主模块,然后它将启动我们的程序。

目标2,单独尝试模块的功能:

假设我们想在上面的示例中尝试bar.py模块中的函数talk,而不运行整个程序,即不调用foo.py模块。为此,我们必须稍微更改bar.py:

# bar.py

def talk():
    print("bar")

if __name__ == '__main__':
    talk()

现在在终端中运行这个命令:python3bar.py#<--单独尝试模块的功能,然后它将打印条。

现在,我们知道了如何处理模块,让我们回到主要问题:

与常规模块相比,包模块有什么特别之处?

1.Python中的常规模块只是“文件”,而包模块则是“目录”。

2.常规模块可以“导入”并且可以“执行”(如上面的示例所示),包模块也可以“导入“并且可以“运行”,然而,您可能会正确地抱怨:“但是我们不能直接在目录中编写代码!代码只在文件中编写!”,这确实是一个很好的抱怨,因为它导致了包模块的第二个特殊之处。包模块的代码是在其目录中的文件中编写的,这些文件的名称也是Python保留的。如果要“导入”一个包模块,则必须将其代码放在其目录中的__init__.py文件中;如果要“执行”包模块,必须将其执行代码放在目录中的___main__.py文件夹中。

下面是上面解释的最后一个例子:

# hierarchy of files and folders:
.
├── bar_pack/
│   ├── __init__.py
│   ├── __main__.py
│   foo.py
# bar_pack/__init__.py

def talk():
    print("bar")
# bar_pack/__main__.py

import __init__

__init__.talk()
# foo.py

import bar_pack # <-- importing package module "bar_pack"

bar_pack.talk() # <-- prints "bar"
# Run this command in the terminal:
python3 bar_pack # <-- executing the package module "bar_pack", prints "bar"

其他回答

迟来的答案,还有另一个定义:

包由导入的顶级实体表示,该顶级实体可以是一个独立模块,或__init__.py特殊模块作为子目录结构中的一组模块中的顶级实体。

因此,包实际上是一个分发单元,它提供一个或多个模块。

首先,请记住,在其精确定义中,模块是Python解释器内存中的一个对象,通常通过从磁盘读取一个或多个文件来创建。虽然我们可以非正式地将磁盘文件(如a/b/c.py)称为“模块”,但在它与其他几个源(如sys.path)的信息结合起来创建模块对象之前,它实际上并不是一个模块。

(例如,请注意,根据sys.path和其他设置,可以从同一个文件加载两个不同名称的模块。这正是python-m my.module在解释器中后跟import my.module时所发生的情况;将有两个模块对象__main__和my.modules,它们都是从磁盘上的同一文件my/module.py创建的。)

包是可能具有子模块(包括子包)的模块。并非所有模块都能做到这一点。例如,创建一个小模块层次结构:

$ mkdir -p a/b
$ touch a/b/c.py

确保a下没有其他文件。启动Python 3.4或更高版本的解释器(例如,使用python3-i)并检查以下语句的结果:

import a
a                ⇒ <module 'a' (namespace)>
a.b              ⇒ AttributeError: module 'a' has no attribute 'b'
import a.b.c
a.b              ⇒ <module 'a.b' (namespace)>
a.b.c            ⇒ <module 'a.b.c' from '/home/cjs/a/b/c.py'>

模块a和a.b是包(事实上,一种称为“命名空间包”的特定类型的包,尽管我们在这里不必担心)。然而,模块a.b.c不是一个包。我们可以通过向上面的目录结构中添加另一个文件a/b.py并启动一个新的解释器来演示这一点:

import a.b.c
⇒ ImportError: No module named 'a.b.c'; 'a.b' is not a package
import a.b
a                ⇒ <module 'a' (namespace)>
a.__path__       ⇒ _NamespacePath(['/.../a'])
a.b              ⇒ <module 'a.b' from '/home/cjs/tmp/a/b.py'>
a.b.__path__     ⇒ AttributeError: 'module' object has no attribute '__path__'

Python确保在加载子模块之前加载所有父模块。在上面,它发现a/是一个目录,因此创建了一个命名空间包a,a/b.py是一个Python源文件,它加载并使用该文件创建一个(非包)模块a.b。此时,不能有模块a.b.c,因为a.b不是包,因此不能有子模块。

您还可以在这里看到,包模块a具有__path__属性(包必须具有此属性),但非包模块a.b没有。

这里的其他答案可能仍然有点模糊,所以我希望发布一个更清晰的答案。需要注意的是,问题的标题一开始也有点误导,我认为更好的标题是:“与常规模块相比,包模块有什么特别之处?”。

TL;DR-简短回答:

包也是模块,但它们是其中的一种特殊类型。特别之处在于1。它们是“目录”和2。它们可能包含特殊文件,如__init__.py和__main__.py。

更好地理解-更长的答案:

重点是,包是一种特殊类型的模块,因此我们需要首先从总体上了解模块,然后包模块的特殊之处也会有意义。(注意:我有时会在这个答案中将“包模块”称为“包”,反之亦然)

因此,让我们先从总体上讨论模块,因为它不那么模糊/更容易理解。我们对模块做的基本上有两件事,要么在其他模块中导入它们,要么直接用Python执行它们。

导入模块有一个明显的目标,即访问模块内部的内容。

然而,执行模块通常追求以下两个目标之一:

该模块是一个主模块,执行它将启动我们的程序(或其子程序之一)。我们希望单独尝试该模块的功能,即无需先导入。

让我们通过一些示例来了解所有这些:

导入模块:

# bar.py

def talk():
    print("bar")
# foo.py

import bar # <-- importing module "bar"

bar.talk() # <-- prints "bar"

执行模块

目标1,将模块作为主要模块执行:

让我们假设上面示例中的foo.py模块是启动程序的主模块。我们可以通过在终端中键入以下命令来运行它:python3foo.py#<--执行一个主模块,然后它将启动我们的程序。

目标2,单独尝试模块的功能:

假设我们想在上面的示例中尝试bar.py模块中的函数talk,而不运行整个程序,即不调用foo.py模块。为此,我们必须稍微更改bar.py:

# bar.py

def talk():
    print("bar")

if __name__ == '__main__':
    talk()

现在在终端中运行这个命令:python3bar.py#<--单独尝试模块的功能,然后它将打印条。

现在,我们知道了如何处理模块,让我们回到主要问题:

与常规模块相比,包模块有什么特别之处?

1.Python中的常规模块只是“文件”,而包模块则是“目录”。

2.常规模块可以“导入”并且可以“执行”(如上面的示例所示),包模块也可以“导入“并且可以“运行”,然而,您可能会正确地抱怨:“但是我们不能直接在目录中编写代码!代码只在文件中编写!”,这确实是一个很好的抱怨,因为它导致了包模块的第二个特殊之处。包模块的代码是在其目录中的文件中编写的,这些文件的名称也是Python保留的。如果要“导入”一个包模块,则必须将其代码放在其目录中的__init__.py文件中;如果要“执行”包模块,必须将其执行代码放在目录中的___main__.py文件夹中。

下面是上面解释的最后一个例子:

# hierarchy of files and folders:
.
├── bar_pack/
│   ├── __init__.py
│   ├── __main__.py
│   foo.py
# bar_pack/__init__.py

def talk():
    print("bar")
# bar_pack/__main__.py

import __init__

__init__.talk()
# foo.py

import bar_pack # <-- importing package module "bar_pack"

bar_pack.talk() # <-- prints "bar"
# Run this command in the terminal:
python3 bar_pack # <-- executing the package module "bar_pack", prints "bar"

模块是在一次导入下导入并使用的单个文件。例如

import my_module

包是提供包层次结构的目录中的模块集合。

from my_package.timing.danger.internets import function_of_love

模块文档

软件包简介

任何Python文件都是一个模块,其名称是文件的基本名称,不带.py扩展名。包是Python模块的集合:虽然模块是单个Python文件,但包是包含额外__init__.py文件的Python模块目录,以区分包和恰好包含一堆Python脚本的目录。只要相应的目录包含自己的__init__.py文件,包可以嵌套到任何深度。

模块和包之间的区别似乎只在文件系统级别上存在。当您导入模块或包时,Python创建的相应对象总是模块类型。但是,请注意,当您导入包时,只有该包的__init__.py文件中的变量/函数/类是直接可见的,而不是子包或模块。例如,考虑Python标准库中的xml包:其xml目录包含__init__.py文件和四个子目录;子目录etree包含__init__.py文件,以及ElementTree.py文件。查看尝试以交互方式导入包/模块时发生的情况:

>>> import xml
>>> type(xml)
<type 'module'>
>>> xml.etree.ElementTree
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'module' object has no attribute 'etree'
>>> import xml.etree
>>> type(xml.etree)
<type 'module'>
>>> xml.etree.ElementTree
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'module' object has no attribute 'ElementTree'
>>> import xml.etree.ElementTree
>>> type(xml.etree.ElementTree)
<type 'module'>
>>> xml.etree.ElementTree.parse
<function parse at 0x00B135B0>

在Python中,也有内置模块,如sys,它们是用C编写的,但我不认为您打算在问题中考虑这些模块。