不能pickle <type 'instancemethod'>当使用多处理Pool.map()

我试图使用multiprocessing的Pool.map()函数来同时划分工作。当我使用以下代码时，它工作得很好:

import multiprocessing

def f(x):
    return x*x

def go():
    pool = multiprocessing.Pool(processes=4)        
    print pool.map(f, range(10))


if __name__== '__main__' :
    go()

然而，当我在更面向对象的方法中使用它时，它就不起作用了。它给出的错误信息是:

PicklingError: Can't pickle <type 'instancemethod'>: attribute lookup
__builtin__.instancemethod failed

这发生时，以下是我的主程序:

import someClass

if __name__== '__main__' :
    sc = someClass.someClass()
    sc.go()

下面是我的someClass类:

import multiprocessing

class someClass(object):
    def __init__(self):
        pass

    def f(self, x):
        return x*x

    def go(self):
        pool = multiprocessing.Pool(processes=4)       
        print pool.map(self.f, range(10))

有人知道问题是什么吗，或者有什么简单的解决方法吗?

当前回答

对此，一个潜在的简单解决方案是切换到使用multiprocessing.dummy。这是一个基于线程的多处理接口实现，在Python 2.7中似乎没有这个问题。我在这方面没有太多经验，但是这个快速的导入更改允许我在类方法上调用apply_async。

一些关于multi - processing.dummy的好资源:

https://docs.python.org/2/library/multiprocessing.html#module-multiprocessing.dummy

http://chriskiehl.com/article/parallelism-in-one-line/

2016-12-20 05:08:35

其他回答

甚至不需要安装完整的悲情包。

实际上，唯一需要的包是dill (pip install dill)，然后用dill覆盖多处理Pickler:

dill.Pickler.dumps, dill.Pickler.loads = dill.dumps, dill.loads
multiprocessing.reduction.ForkingPickler = dill.Pickler
multiprocessing.reduction.dump = dill.dump

这个答案来自https://stackoverflow.com/a/69253561/10686785

2022-09-02 07:51:14

上面parisjohn的解决方案对我很有效。此外，代码看起来很干净，易于理解。在我的例子中，有几个函数要使用Pool调用，所以我在下面修改了parisjohn的代码。我使__call__能够调用几个函数，函数名在go()的参数dict中传递:

from multiprocessing import Pool
class someClass(object):
    def __init__(self):
        pass
    
    def f(self, x):
        return x*x
    
    def g(self, x):
        return x*x+1    

    def go(self):
        p = Pool(4)
        sc = p.map(self, [{"func": "f", "v": 1}, {"func": "g", "v": 2}])
        print sc

    def __call__(self, x):
        if x["func"]=="f":
            return self.f(x["v"])
        if x["func"]=="g":
            return self.g(x["v"])        

sc = someClass()
sc.go()

2018-06-27 14:10:21

更新:在撰写本文的当天，namedTuples是可选的(从python 2.7开始)

这里的问题是子进程不能导入对象的类-在这种情况下，类P-，在多模型项目的情况下，类P应该可以在使用子进程的任何地方导入

一个快速的解决方法是通过将其影响为globals()使其可导入

globals()["P"] = P

2018-06-11 13:27:12

在这个简单的例子中，someClass。F没有从类中继承任何数据，也没有向类中附加任何数据，一个可能的解决方案是将F分离出来，这样它就可以被pickle:

import multiprocessing


def f(x):
    return x*x


class someClass(object):
    def __init__(self):
        pass

    def go(self):
        pool = multiprocessing.Pool(processes=4)       
        print pool.map(f, range(10))

2018-03-23 18:14:11

感伤。多重处理对我很有用。

与多处理不同，它有一个池方法，可以序列化所有东西

import pathos.multiprocessing as mp
pool = mp.Pool(processes=2)

2021-11-29 11:28:43

不能pickle <type 'instancemethod'>当使用多处理Pool.map()

推荐文章

最新文章

标签