“最小惊奇”与可变默认参数

任何人只要长时间摆弄Python，都会被以下问题所困扰（或撕成碎片）：

def foo(a=[]):
    a.append(5)
    return a

Python新手希望这个没有参数的函数总是返回一个只有一个元素的列表：[5]。结果却非常不同，非常令人惊讶（对于新手来说）：

>>> foo()
[5]
>>> foo()
[5, 5]
>>> foo()
[5, 5, 5]
>>> foo()
[5, 5, 5, 5]
>>> foo()

我的一位经理曾第一次接触到这个功能，并称其为语言的“戏剧性设计缺陷”。我回答说，这种行为有一个潜在的解释，如果你不了解其内部，这确实非常令人困惑和意外。然而，我无法（对自己）回答以下问题：在函数定义时而不是在函数执行时绑定默认参数的原因是什么？我怀疑有经验的行为是否有实际用途（谁真的在C中使用了静态变量，而没有滋生bug？）

编辑：

Baczek举了一个有趣的例子。连同您的大多数评论，特别是Utaal的评论，我进一步阐述了：

>>> def a():
...     print("a executed")
...     return []
... 
>>>            
>>> def b(x=a()):
...     x.append(5)
...     print(x)
... 
a executed
>>> b()
[5]
>>> b()
[5, 5]

在我看来，设计决策似乎与将参数范围放在哪里有关：放在函数内部，还是与函数“一起”？

在函数内部进行绑定意味着当函数被调用而不是被定义时，x被有效地绑定到指定的默认值，这将带来一个严重的缺陷：def行将是“混合”的，即部分绑定（函数对象）将在定义时发生，部分绑定（默认参数的赋值）将在函数调用时发生。

实际行为更加一致：当执行该行时，该行的所有内容都会得到求值，这意味着在函数定义时。

当前回答

嗯，原因很简单，绑定是在代码执行时完成的，函数定义是执行的，嗯。。。当定义函数时。

比较一下：

class BananaBunch:
    bananas = []

    def addBanana(self, banana):
        self.bananas.append(banana)

这段代码遭遇了完全相同的意外事件。香蕉是一个类属性，因此，当您向它添加内容时，它会添加到该类的所有实例中。原因完全相同。

这只是“它是如何工作的”，在函数情况下使它以不同的方式工作可能会很复杂，在类情况下可能是不可能的，或者至少会大大降低对象实例化的速度，因为您必须保留类代码，并在创建对象时执行它。

是的，这是出乎意料的。但一旦一分钱下降，它就完全符合Python的工作原理。事实上，这是一个很好的教学辅助工具，一旦你了解了为什么会发生这种情况，你就会更好地了解python。

也就是说，它应该在任何好的Python教程中占据突出位置。因为正如你提到的，每个人迟早都会遇到这个问题。

2009-07-15 18:54:45

其他回答

这种行为很容易解释为：

函数（类等）声明只执行一次，创建所有默认值对象所有内容都通过引用传递

So:

def x(a=0, b=[], c=[], d=0):
    a = a + 1
    b = b + [1]
    c.append(1)
    print a, b, c

a不改变-每次赋值调用都创建新的int对象-打印新对象b不变-新数组是从默认值构建并打印的c更改-对同一对象执行操作-并打印

2009-07-15 19:15:25

这个“bug”给了我很多加班时间！但我开始看到它的潜在用途（但我还是希望它在执行时使用）

我会给你一个我认为有用的例子。

def example(errors=[]):
    # statements
    # Something went wrong
    mistake = True
    if mistake:
        tryToFixIt(errors)
        # Didn't work.. let's try again
        tryToFixItAnotherway(errors)
        # This time it worked
    return errors

def tryToFixIt(err):
    err.append('Attempt to fix it')

def tryToFixItAnotherway(err):
    err.append('Attempt to fix it by another way')

def main():
    for item in range(2):
        errors = example()
    print '\n'.join(errors)

main()

打印以下内容

Attempt to fix it
Attempt to fix it by another way
Attempt to fix it
Attempt to fix it by another way

2013-07-22 07:35:28

如果考虑到以下因素，这种行为并不奇怪：

尝试赋值时只读类属性的行为，以及函数是对象（在公认的答案中解释得很好）。

（2）的作用已在本主题中广泛讨论。（1）很可能是令人惊讶的原因，因为这种行为在来自其他语言时并不“直观”。

（1）在Python教程中对类进行了描述。尝试将值分配给只读类属性时：

…在最内部范围之外找到的所有变量都是只读（尝试写入这样的变量只会创建一个最内部范围中的新局部变量，保留相同的命名的外部变量保持不变）。

回顾最初的示例，并考虑以上几点：

def foo(a=[]):
    a.append(5)
    return a

这里foo是一个对象，a是foo的一个属性（在foo.func_defs[0]中可用）。由于a是一个列表，因此a是可变的，因此是foo读写属性。当函数实例化时，它被初始化为签名指定的空列表，并且只要函数对象存在，它就可用于读取和写入。

在不覆盖默认值的情况下调用foo使用foo.func_defs中的默认值。在这种情况下，foo.func_descfs[0]用于函数内对象的代码范围。更改foo.func_defs[0]，它是foo对象的一部分，在执行foo中的代码之间持续存在。

现在，将其与文档中关于模拟其他语言的默认参数行为的示例进行比较，以便每次执行函数时都使用函数签名默认值：

def foo(a, L=None):
    if L is None:
        L = []
    L.append(a)
    return L

考虑到（1）和（2），可以看出为什么这会实现所需的行为：

当foo函数对象被实例化时，foo.func_defs[0]被设置为None，这是一个不可变的对象。当函数以默认值执行时（函数调用中没有为L指定参数），foo.func_defs[0]（None）在本地作用域中可用为L。当L=[]时，foo.func_defs[0]处的赋值无法成功，因为该属性是只读的。根据（1），在局部作用域中创建一个新的局部变量（也称为L），并用于函数调用的其余部分。因此，对于未来的foo调用，foo.func_defs[0]保持不变。

2012-04-24 19:43:13

嗯，原因很简单，绑定是在代码执行时完成的，函数定义是执行的，嗯。。。当定义函数时。

比较一下：

class BananaBunch:
    bananas = []

    def addBanana(self, banana):
        self.bananas.append(banana)

这段代码遭遇了完全相同的意外事件。香蕉是一个类属性，因此，当您向它添加内容时，它会添加到该类的所有实例中。原因完全相同。

也就是说，它应该在任何好的Python教程中占据突出位置。因为正如你提到的，每个人迟早都会遇到这个问题。

2009-07-15 18:54:45

你为什么不反省一下？

我真的很惊讶没有人对可调用对象执行Python（2和3适用）提供的深刻反省。

给定一个简单的小函数func，定义为：

>>> def func(a = []):
...    a.append(5)

当Python遇到它时，它要做的第一件事就是编译它，以便为这个函数创建一个代码对象。在完成此编译步骤时，Python计算*，然后将默认参数（此处为空列表[]）存储在函数对象本身中。正如上面提到的答案：列表a现在可以被认为是函数func的成员。

因此，让我们做一些内省，前后检查一下列表是如何在函数对象内部展开的。我使用的是Python 3.x，对于Python 2也是如此（在Python 2中使用__defaults__或func_faults；是的，两个名称表示相同的东西）。

执行前功能：

>>> def func(a = []):
...     a.append(5)
...

Python执行此定义后，它将接受指定的任何默认参数（此处a=[]），并将它们填充到函数对象的__defaults__属性中（相关部分：Callables）：

>>> func.__defaults__
([],)

好的，所以__defaults__中的单个条目是一个空列表，正如预期的那样。

执行后的功能：

现在让我们执行此函数：

>>> func()

现在，让我们再次看看这些__defaults__：

>>> func.__defaults__
([5],)

惊讶的？对象内部的值发生了变化！对函数的连续调用现在只需追加到嵌入的列表对象：

>>> func(); func(); func()
>>> func.__defaults__
([5, 5, 5, 5],)

所以，这就是为什么会出现这种“缺陷”的原因，因为默认参数是函数对象的一部分。这里没有什么奇怪的事情，只是有点令人惊讶。

解决此问题的常见方法是使用None作为默认值，然后在函数体中初始化：

def func(a = None):
    # or: a = [] if a is None else a
    if a is None:
        a = []

由于每次都会重新执行函数体，因此如果没有为a传递参数，则总是会得到一个新的空列表。

要进一步验证__defaults__中的列表与函数func中使用的列表相同，只需更改函数以返回函数体中使用的list a的id。然后，将其与__defaults__中的列表（__defaults_中的位置[0]）进行比较，您将看到这些列表实际上是如何引用同一列表实例的：

>>> def func(a = []): 
...     a.append(5)
...     return id(a)
>>>
>>> id(func.__defaults__[0]) == func()
True

一切都有自省的力量！

*要验证Python在编译函数期间是否计算默认参数，请尝试执行以下操作：

def bar(a=input('Did you just see me without calling the function?')): 
    pass  # use raw_input in Py2

正如您会注意到的，在构建函数并将其绑定到名称栏的过程之前，会调用input（）。

2015-12-09 07:13:28

“最小惊奇”与可变默认参数

推荐文章

最新文章

标签