有没有办法让defaultdict也成为defaultdict的默认值?(即无限级递归defaultdict?)

我希望能够做到:

x = defaultdict(...stuff...)
x[0][1][0]
{}

所以,我可以做x = defaultdict(defaultdict)但这只是第二层:

x[0]
{}
x[0][0]
KeyError: 0

有些食谱可以做到这一点。但是仅仅使用普通的defaultdict参数就可以做到吗?

注意,这是在询问如何做一个无限级递归defaultdict,所以它与Python不同:defaultdict of defaultdict?,这是如何做一个两级defaultdict。

我可能最终会使用串模式,但当我意识到我不知道如何做时,它让我感兴趣。


当前回答

这里有一个类似于@Stanislav的答案的解决方案,适用于多处理,也允许终止嵌套:

from collections import defaultdict
from functools import partial

class NestedDD(defaultdict):
    def __init__(self, n, *args, **kwargs):
        self.n = n
        factory = partial(build_nested_dd, n=n - 1) if n > 1 else int
        super().__init__(factory, *args, **kwargs)

    def __repr__(self):
        return repr(dict(self))

def build_nested_dd(n):
    return NestedDD(n)

其他回答

下面是一个函数,用于嵌套的任意深度的任意基defaultdict。

(cross post from Can't pickle defaultdict)

def wrap_defaultdict(instance, times=1):
    """Wrap an instance an arbitrary number of `times` to create nested defaultdict.
    
    Parameters
    ----------
    instance - list, dict, int, collections.Counter
    times - the number of nested keys above `instance`; if `times=3` dd[one][two][three] = instance
    
    Notes
    -----
    using `x.copy` allows pickling (loading to ipyparallel cluster or pkldump)
        - thanks https://stackoverflow.com/questions/16439301/cant-pickle-defaultdict
    """
    from collections import defaultdict

    def _dd(x):
        return defaultdict(x.copy)

    dd = defaultdict(instance)
    for i in range(times-1):
        dd = _dd(dd)

    return dd

这里的其他答案告诉您如何创建一个包含“无限多个”defaultdict的defaultdict,但它们未能解决我认为可能是您最初的需求,即简单地拥有一个双深度defaultdict。

你可能一直在寻找:

defaultdict(lambda: defaultdict(dict))

你可能更喜欢这个结构的原因是:

它比递归解决方案更明确,因此读者可能更容易理解。 这使得defaultdict的“叶子”可以是字典以外的东西,例如:defaultdict(lambda: defaultdict(list))或defaultdict(lambda: defaultdict(set))

类似于BrenBarn的解决方案,但不包含两次变量树的名称,所以即使在修改变量字典后也能工作:

tree = (lambda f: f(f))(lambda a: (lambda: defaultdict(a(a))))

然后你可以用x = tree()创建每个新的x。


对于def版本,我们可以使用函数闭包作用域来保护数据结构,避免在树名为“反弹”时现有实例停止工作的缺陷。它是这样的:

from collections import defaultdict

def tree():
    def the_tree():
        return defaultdict(the_tree)
    return the_tree()

下面是一个递归函数,用于将递归默认字典转换为普通字典

def defdict_to_dict(defdict, finaldict):
    # pass in an empty dict for finaldict
    for k, v in defdict.items():
        if isinstance(v, defaultdict):
            # new level created and that is the new value
            finaldict[k] = defdict_to_dict(v, {})
        else:
            finaldict[k] = v
    return finaldict

defdict_to_dict(my_rec_default_dict, {})

我基于安德鲁的回答。 如果你想从json或现有的dict中加载数据到nester defaultdict中,请看这个例子:

def nested_defaultdict(existing=None, **kwargs):
    if existing is None:
        existing = {}
    if not isinstance(existing, dict):
        return existing
    existing = {key: nested_defaultdict(val) for key, val in existing.items()}
    return defaultdict(nested_defaultdict, existing, **kwargs)

https://gist.github.com/nucklehead/2d29628bb49115f3c30e78c071207775