Python的作用域规则究竟是什么?

如果我有一些代码:

code1
class Foo:
   code2
   def spam.....
      code3
      for code4..:
       code5
       x()

x在哪?一些可能的选择包括以下列表:

在封闭的源文件中 在类名称空间中 在函数定义中 在for循环的索引变量中 在for循环中

还有执行期间的上下文,当函数spam被传递到其他地方时。也许lambda函数传递有点不同?

在某个地方一定有一个简单的参考或算法。对于中级Python程序员来说,这是一个令人困惑的世界。


当前回答

Python名称解析只知道以下几种作用域:

builtins作用域,提供内置函数,如print, int或zip, 模块全局作用域,总是当前模块的顶层, 三个用户定义的作用域可以相互嵌套,即 函数闭包范围,从任何封闭的def块,lambda表达式或理解。 函数局部作用域,在一个def块,lambda表达式或理解, 类作用域,在类块内。

值得注意的是,其他结构,如if、for或with语句没有自己的作用域。

作用域TLDR:名称的查找从使用该名称的作用域开始,然后是任何外围作用域(不包括类作用域),到模块全局作用域,最后是内置作用域——使用此搜索顺序中的第一个匹配。 对作用域的赋值默认为当前作用域-必须使用特殊形式nonlocal和global来对来自外部作用域的名称进行赋值。

最后,推导式和生成器表达式以及:=赋值表达式在组合时有一个特殊的规则。


嵌套作用域和名称解析

这些不同的作用域构建了一个层次结构,其中内置的全局变量总是构成基,闭包、局部变量和类作用域是按词法定义嵌套的。也就是说,只有源代码中的嵌套是重要的,而不是调用堆栈。

print("builtins are available without definition")

some_global = "1"  # global variables are at module scope

def outer_function():
    some_closure = "3.1"  # locals and closure are defined the same, at function scope
    some_local = "3.2"    # a variable becomes a closure if a nested scope uses it

    class InnerClass:
         some_classvar = "3.3"   # class variables exist *only* at class scope

         def inner_function(self):
             some_local = "3.2"   # locals can replace outer names
             print(some_closure)  # closures are always readable
    return InnerClass

尽管类创建了一个作用域,并且可能有嵌套的类、函数和推导式,但类作用域的名称对于封闭的作用域是不可见的。这将创建以下层次结构:

┎ builtins           [print, ...]
┗━┱ globals            [some_global]
  ┗━┱ outer_function     [some_local, some_closure]
    ┣━╾ InnerClass         [some_classvar]
    ┗━╾ inner_function     [some_local]

Name resolution always starts at the current scope in which a name is accessed, then goes up the hierarchy until a match is found. For example, looking up some_local inside outer_function and inner_function starts at the respective function - and immediately finds the some_local defined in outer_function and inner_function, respectively. When a name is not local, it is fetched from the nearest enclosing scope that defines it – looking up some_closure and print inside inner_function searches until outer_function and builtins, respectively.


作用域声明和名称绑定

默认情况下,名称属于将其绑定到值的任何范围。在内部作用域中再次绑定相同的名称会创建一个具有相同名称的新变量——例如,some_local分别存在于outer_function和inner_function中。就作用域而言,绑定包括设置赋名语句值的任何语句,还包括for循环的迭代变量或with上下文管理器的名称。值得注意的是,del也可以算作名称绑定。

当一个名称必须引用外部变量并被绑定到内部作用域时,该名称必须声明为非本地名称。对于不同类型的封闭作用域存在单独的声明:nonlocal总是引用最近的闭包,global总是引用全局名称。值得注意的是,nonlocal从不引用全局名称,global忽略所有同名的闭包。没有引用内置作用域的声明。


some_global = "1"

def outer_function():
    some_closure = "3.2"
    some_global = "this is ignored by a nested global declaration"
    
    def inner_function():
        global some_global     # declare variable from global scope
        nonlocal some_closure  # declare variable from enclosing scope
        message = " bound by an inner scope"
        some_global = some_global + message
        some_closure = some_closure + message
    return inner_function

值得注意的是,函数局部和非局部是在编译时解析的。非本地名称必须存在于某个外部作用域中。相反,全局名称可以动态定义,并且可以随时从全局作用域添加或删除。


推导式和赋值表达式

列表、集合和字典推导式以及生成器表达式的作用域规则几乎与函数相同。同样,赋值表达式的作用域规则与常规名称绑定几乎相同。

推导式和生成器表达式的作用域与函数作用域相同。作用域中绑定的所有名称,即迭代变量,都是推导式/生成器和嵌套作用域的局部变量或闭包。所有名称,包括可迭代对象,都在函数内部使用名称解析进行解析。

some_global = "global"

def outer_function():
    some_closure = "closure"
    return [            # new function-like scope started by comprehension
        comp_local      # names resolved using regular name resolution
        for comp_local  # iteration targets are local
        in "iterable"
        if comp_local in some_global and comp_local in some_global
    ]

赋值表达式适用于最近的函数、类或全局作用域。值得注意的是,如果赋值表达式的目标在最近的作用域中被声明为非局部或全局,则赋值表达式将像常规赋值一样执行此操作。

print(some_global := "global")

def outer_function():
    print(some_closure := "closure")

但是,理解式/生成器中的赋值表达式工作在理解式/生成器的最近的封闭范围上,而不是理解式/生成器本身的范围上。当嵌套多个推导式/生成器时,使用最近的函数或全局作用域。由于理解式/生成器作用域可以读取闭包和全局变量,因此赋值变量在理解式中也是可读的。从理解式赋值到类作用域是无效的。

print(some_global := "global")

def outer_function():
    print(some_closure := "closure")
    steps = [
        # v write to variable in containing scope
        (some_closure := some_closure + comp_local)
        #                 ^ read from variable in containing scope
        for comp_local in some_global
    ]
    return some_closure, steps

虽然迭代变量对于它所绑定的理解是局部的,但赋值表达式的目标并不创建局部变量,而是从外部作用域读取:

┎ builtins           [print, ...]
┗━┱ globals            [some_global]
  ┗━┱ outer_function     [some_closure]
    ┗━╾ <listcomp>         [comp_local]

其他回答

Python通常用三个可用的名称空间来解析变量。

在执行过程中的任何时候 至少有三个嵌套作用域是谁的 命名空间可以直接访问: 最里面的作用域,用于搜索 首先,包含本地名称;的 任何封闭函数的命名空间, 从?开始搜索哪些 最近的包围范围;中间 范围,接下来搜索,包含 当前模块的全局名称;和 最外层作用域(最后搜索)是 包含内置名称的命名空间。

有两个函数:全局函数和局部函数,它们向您显示这两个名称空间的内容。

命名空间是由包、模块、类、对象结构和函数创建的。没有其他类型的名称空间。

在这种情况下,对名为x的函数的调用必须在本地名称空间或全局名称空间中解析。

在本例中,Local是方法函数Foo.spam的主体。

全球就是——嗯——全球。

规则是搜索由方法函数(以及嵌套函数定义)创建的嵌套局部空间,然后搜索全局。就是这样。

没有其他的范围了。for语句(以及其他复合语句,如if和try)不会创建新的嵌套作用域。只有定义(包、模块、函数、类和对象实例)。

在类定义中,名称是类名称空间的一部分。例如,Code2必须由类名限定。一般Foo.code2。然而,自我。code2也可以工作,因为Python对象将包含类视为一个回退。

对象(类的实例)有实例变量。这些名称位于对象的名称空间中。它们必须由对象限定。(variable.instance)。

在类方法中,有局部变量和全局变量。你说自我。变量选择实例作为命名空间。您将注意到self是每个类成员函数的参数,使其成为局部名称空间的一部分。

参见Python作用域规则、Python作用域、变量作用域。

x在哪?

X没有被找到,因为你没有定义它。:-)它可以在code1(全局)或code3(本地)中找到,如果你把它放在那里。

Code2(类成员)对于同一类的方法中的代码是不可见的——您通常会使用self访问它们。Code4 /code5(循环)与code3存在于相同的作用域中,因此如果你在那里写入x,你将改变code3中定义的x实例,而不是创建一个新的x。

Python是静态作用域的,所以如果你将' spam '传递给另一个函数,spam仍然可以访问它来自的模块中的全局变量(在code1中定义),以及任何其他包含作用域的范围(见下文)。Code2成员将再次通过self访问。

lambda与def没有区别。如果在函数中使用lambda,则与定义嵌套函数相同。在Python 2.2以后,可以使用嵌套作用域。在这种情况下,你可以在函数嵌套的任何级别绑定x, Python将会获取最内层的实例:

x= 0
def fun1():
    x= 1
    def fun2():
        x= 2
        def fun3():
            return x
        return fun3()
    return fun2()
print fun1(), x

2 0

Fun3看到来自最近的包含作用域的实例x,该作用域是与fun2关联的函数作用域。但是在fun1和全局中定义的其他x实例不受影响。

在Python 2.1之前的nested_scopes之前,以及2.1中,除非你特别要求使用from-future-import功能,否则fun1和fun2的作用域对fun3是不可见的,所以S.Lott的答案成立,你将得到全局x:

0 0

关于Python3时间没有彻底的答案,所以我在这里做了一个回答。这里描述的大部分内容在Python 3文档的4.2.2名称解析中详细描述。

正如在其他回答中提供的,有4个基本范围,即LEGB,分别表示本地、封闭、全局和内置。除此之外,还有一个特殊的作用域,即类体,它不包含类内定义的方法的封闭作用域;类体中的任何赋值都将使该变量从此被绑定到类体中。

特别是,除了def和class,没有块语句创建变量作用域。在Python 2中,列表推导式不创建变量作用域,但在Python 3中,列表推导式中的循环变量是在新的作用域中创建的。

为了证明阶级主体的特殊性

x = 0
class X(object):
    y = x
    x = x + 1 # x is now a variable
    z = x

    def method(self):
        print(self.x) # -> 1
        print(x)      # -> 0, the global x
        print(y)      # -> NameError: global name 'y' is not defined

inst = X()
print(inst.x, inst.y, inst.z, x) # -> (1, 0, 1, 0)

因此,与在函数体中不同的是,你可以将变量重新赋值给类体中的相同名称,以获得具有相同名称的类变量;进一步查找此名称将解析 改为类变量。


对于许多Python新手来说,一个更大的惊喜是for循环不创建变量作用域。在Python 2中,列表推导式也不创建作用域(而生成器和字典推导式可以!)相反,它们会泄漏函数或全局作用域中的值:

>>> [ i for i in range(5) ]
>>> i
4

在Python 2中,推导式可以用作在lambda表达式中创建可修改变量的狡猾(如果你愿意,也可以是可怕的)方法——lambda表达式确实创建了一个变量作用域,就像def语句一样,但在lambda中不允许任何语句。赋值在Python中是一个语句,这意味着lambda中不允许变量赋值,但列表理解式是一个表达式…

这种行为在Python 3中已经修复——没有理解表达式或生成器泄漏变量。


全局指的是模块作用域;python的主要模块是__main__;所有导入的模块都可以通过sys. sys访问。模块变量;要访问__main__,可以使用sys. js。模块['__main__'],或导入__main__;在那里访问和赋值属性是完全可以接受的;它们将作为变量显示在主模块的全局作用域中。


如果一个名称在当前作用域中被赋值(类作用域除外),它将被认为属于该作用域,否则它将被认为属于赋值给该变量的任何封闭作用域(它可能还没有被赋值,或者根本没有赋值),或者最终属于全局作用域。如果变量被认为是本地的,但尚未设置或已删除,读取变量值将导致UnboundLocalError,它是NameError的子类。

x = 5
def foobar():
    print(x)  # causes UnboundLocalError!
    x += 1    # because assignment here makes x a local variable within the function

# call the function
foobar()

作用域可以声明它显式地想要修改全局(模块作用域)变量,使用global关键字:

x = 5
def foobar():
    global x
    print(x)
    x += 1

foobar() # -> 5
print(x) # -> 6

这也是可能的,即使它是封闭范围的阴影:

x = 5
y = 13
def make_closure():
    x = 42
    y = 911
    def func():
        global x # sees the global value
        print(x, y)
        x += 1

    return func

func = make_closure()
func()      # -> 5 911
print(x, y) # -> 6 13

在python 2中,没有简单的方法来修改封闭范围内的值;通常这是通过一个可变值来模拟的,比如一个长度为1的列表:

def make_closure():
    value = [0]
    def get_next_value():
        value[0] += 1
        return value[0]

    return get_next_value

get_next = make_closure()
print(get_next()) # -> 1
print(get_next()) # -> 2

然而在python3中,nonlocal来拯救:

def make_closure():
    value = 0
    def get_next_value():
        nonlocal value
        value += 1
        return value
    return get_next_value

get_next = make_closure() # identical behavior to the previous example.

非本地文档是这么说的

与全局语句中列出的名称不同,非局部语句中列出的名称必须引用封闭作用域中的预先存在的绑定(不能明确确定应该在其中创建新绑定的作用域)。

即nonlocal总是指名称被绑定的最内外部的非全局作用域(即赋值给,包括用作for目标变量,在with子句中,或作为函数参数)。


Any variable that is not deemed to be local to the current scope, or any enclosing scope, is a global variable. A global name is looked up in the module global dictionary; if not found, the global is then looked up from the builtins module; the name of the module was changed from python 2 to python 3; in python 2 it was __builtin__ and in python 3 it is now called builtins. If you assign to an attribute of builtins module, it will be visible thereafter to any module as a readable global variable, unless that module shadows them with its own global variable with the same name.


读取内置模块也很有用;假设您希望在文件的某些部分使用python 3样式的print函数,但文件的其他部分仍然使用print语句。在Python 2.6-2.7中,你可以通过以下方法获得Python 3 print函数:

import __builtin__

print3 = __builtin__.__dict__['print']

from __future__ import print_function实际上不会在Python 2中的任何地方导入print函数——相反,它只是禁用当前模块中print语句的解析规则,像处理任何其他变量标识符一样处理print,从而允许在内置中查找print函数。

本质上,Python中唯一引入新作用域的是函数定义。类有点特殊,因为在主体中直接定义的任何东西都放在类的名称空间中,但它们不能从它们所包含的方法(或嵌套类)中直接访问。

在你的例子中,只有3个范围x将被搜索:

垃圾邮件的作用域——包含code3和code5(以及循环变量code4)中定义的所有内容 全局作用域——包含代码1中定义的所有内容,以及Foo(以及其后的任何更改) 内置命名空间。有点特殊的情况-它包含各种Python内置函数和类型,如len()和str()。一般来说,任何用户代码都不应该修改它,所以期望它只包含标准函数。

只有在向图中引入嵌套函数(或lambda)时,才会出现更多作用域。 不过,它们的表现和你预期的差不多。嵌套函数可以访问局部作用域中的所有内容,也可以访问封闭函数作用域中的任何内容。如。

def foo():
    x=4
    def bar():
        print x  # Accesses x from foo's scope
    bar()  # Prints 4
    x=5
    bar()  # Prints 5

限制:

可以访问局部函数变量以外的作用域中的变量,但不能在没有进一步语法的情况下反弹到新参数。相反,赋值将创建一个新的局部变量,而不是影响父作用域中的变量。例如:

global_var1 = []
global_var2 = 1

def func():
    # This is OK: It's just accessing, not rebinding
    global_var1.append(4) 

    # This won't affect global_var2. Instead it creates a new variable
    global_var2 = 2 

    local1 = 4
    def embedded_func():
        # Again, this doen't affect func's local1 variable.  It creates a 
        # new local variable also called local1 instead.
        local1 = 5
        print local1

    embedded_func() # Prints 5
    print local1    # Prints 4

为了从函数作用域中实际修改全局变量的绑定,需要使用global关键字指定变量为全局变量。例如:

global_var = 4
def change_global():
    global global_var
    global_var = global_var + 1

目前还没有办法对封闭函数作用域中的变量做同样的事情,但Python 3引入了一个新的关键字“nonlocal”,它将以类似于global的方式起作用,但用于嵌套函数作用域。

在Python中,

任何被赋值的变量都是所在块的局部变量 作业出现了。

如果在当前范围内找不到变量,请参考LEGB顺序。