Python如何在使用multiprocess.pool中，共享自定义类实例或者包

2023-04-14 15:12| 来源: 网络整理| 查看: 265

在使用multiprocessing.pool时，可以通过以下方式实现共享自定义类实例或者包：

使用multiprocessing.Manager来创建一个共享的命名空间，该命名空间可用于存储需要共享的对象。可以使用Manager()方法来创建一个新的管理器实例，然后使用Namespace()方法创建一个新的命名空间。将需要共享的对象传递给工作进程池中的函数。这些函数可以从共享命名空间中获取对象，对其进行更改，并将更改后的对象写回共享命名空间中。如果需要在工作进程池中使用自定义类实例，则需要确保该类可序列化。可以通过实现__getstate__()和__setstate__()方法来完成这一点，以便序列化和反序列化对象。另外，还需要在每个工作进程池中导入该类的定义，以便使用该类。

下面是一个示例代码，演示如何在使用multiprocessing.pool中共享自定义类实例和包：

pythonCopy code import multiprocessing as mp from multiprocessing import Manager import my_module # 定义自定义类 class MyClass: def __init__(self): self.value = 0 def increment(self): self.value += 1 # 定义工作进程池中的函数 def worker_func(shared_namespace): # 从共享命名空间中获取对象 my_object = shared_namespace.my_object # 使用自定义类实例 my_object.increment() # 使用共享的包 my_module.my_function() # 将更改后的对象写回共享命名空间中 shared_namespace.my_object = my_object if __name__ == '__main__': # 创建共享命名空间 manager = Manager() shared_namespace = manager.Namespace() # 创建自定义类实例并添加到共享命名空间中 my_object = MyClass() shared_namespace.my_object = my_object # 创建工作进程池并执行工作函数 with mp.Pool(processes=4) as pool: pool.map(worker_func, [shared_namespace]*4) # 从共享命名空间中获取更改后的对象 my_object = shared_namespace.my_object print(my_object.value)

在上面的示例中，我们首先创建了一个自定义类MyClass，该类具有一个increment方法，用于增加类的value属性的值。然后，我们使用multiprocessing.Manager创建了一个共享命名空间，并将MyClass实例添加到其中。接下来，我们使用工作进程池中的函数worker_func来获取共享命名空间中的MyClass实例，并使用其increment方法进行更改。我们还使用共享的包my_module中的函数my_function。最后，我们从共享命名空间中获取更改后的对象，并输出其value属性的值。注意，由于MyClass不是原生可序列化的，因此我们需要注意，由于MyClass不是原生可序列化的，因此我们需要在该类中实现__getstate__()和__setstate__()方法，以便可以将其序列化和反序列化。具体来说，__getstate__()方法应该返回一个包含MyClass实例的字典，而__setstate__()方法应该从字典中恢复MyClass实例。以下是MyClass的修改版本：

pythonCopy code # 定义自定义类 class MyClass: def __init__(self): self.value = 0 def increment(self): self.value += 1 def __getstate__(self): return {'value': self.value} def __setstate__(self, state): self.value = state['value']

在实现__getstate__()和__setstate__()方法后，我们可以将MyClass实例添加到共享命名空间中，然后在工作进程池中使用该实例，如下所示：

pythonCopy code if __name__ == '__main__': # 创建共享命名空间 manager = Manager() shared_namespace = manager.Namespace() # 创建自定义类实例并添加到共享命名空间中 my_object = MyClass() shared_namespace.my_object = my_object # 创建工作进程池并执行工作函数 with mp.Pool(processes=4) as pool: pool.map(worker_func, [shared_namespace]*4) # 从共享命名空间中获取更改后的对象 my_object = shared_namespace.my_object print(my_object.value)

在上面的示例中，我们将MyClass实例my_object添加到共享命名空间中，并将共享命名空间传递给工作进程池中的函数worker_func。在worker_func中，我们可以从共享命名空间中获取my_object，然后使用其increment方法进行更改，并将更改后的对象写回共享命名空间中。最后，我们从共享命名空间中获取更改后的对象，并输出其value属性的值。

总的来说，共享自定义类实例或包时，需要将它们存储在共享的命名空间中，并在工作进程池中使用共享的命名空间来获取和更改这些对象。如果需要在工作进程池中使用自定义类实例，则需要确保该类可序列化，并实现__getstate__()和__setstate__()方法。

除了使用multiprocessing.Manager来创建共享命名空间外，还可以使用multiprocessing.Manager().Value和multiprocessing.Manager().Array方法创建共享值和数组。

如果要共享自定义类实例，可以将其存储在共享数组或值中。这样做的好处是，可以将多个进程之间共享的数据存储在一个位置，而不是在多个位置。这可以减少内存使用和数据传输开销。

以下是一个示例代码，演示如何在使用multiprocessing.pool中共享自定义类实例和包：

pythonCopy code import multiprocessing as mp from multiprocessing import Manager import my_module # 定义自定义类 class MyClass: def __init__(self): self.value = 0 def increment(self): self.value += 1 # 定义工作进程池中的函数 def worker_func(shared_value, shared_array): # 获取共享的值 value = shared_value.value # 获取共享的数组 my_array = shared_array[:] # 获取共享的自定义类实例 my_object = MyClass() my_object.__dict__.update(shared_array[0].__dict__) # 使用自定义类实例 my_object.increment() # 使用共享的包 my_module.my_function() # 将更改后的对象写回共享数组中 my_array[0] = my_object # 将更改后的值写回共享值中 shared_value.value = value + 1 # 将更改后的数组写回共享数组中 shared_array[:] = my_array if __name__ == '__main__': # 创建共享值和数组 manager = Manager() shared_value = manager.Value('i', 0) shared_array = manager.Array('d', [MyClass()]) # 创建工作进程池并执行工作函数 with mp.Pool(processes=4) as pool: pool.map(worker_func, [shared_value]*4, [shared_array]*4) # 从共享数组中获取更改后的对象 my_object = shared_array[0] print(my_object.value) # 从共享值中获取更改后的值 value = shared_value.value print(value)

在上面的示例中，我们首先使用multiprocessing.Manager().Value和multiprocessing.Manager().Array方法创建了共享值和数组。接下来，我们在工作进程池中的函数worker_func中获取共享的值、数组和自定义类实例。我们使用自定义类实例MyClass的increment方法进行更改，并使用共享的包my_module中的函数my_function。最后，我们将更改后的对象、值和数组写回共享对象中。注意，在共享自定义类实例时，我们使用了my_object.__dict__.update(shared_array[0].__dict__)将共享数组中存储的对象的属性值复制到新的对象中。这样可以确保新的对象具有相同的属性值，而不需要重新实例化对象。

在完成工作进程池中的任务后，我们可以从共享数组中获取更改后的对象，并输出其value属性的值。同样，我们可以从共享值中获取更改后的值，并输出其值。

总的来说，使用共享值、数组和命名空间是在使用multiprocessing.pool时共享数据的有效方式。这些方法允许多个进程之间共享数据，并减少了内存使用和数据传输的开销。当使用自定义类实例时，需要注意实现__getstate__()和__setstate__()方法，并将其存储在共享数组中。当使用共享包时，需要在每个工作进程池中导入该包的定义。

【本文地址】

公司简介

联系我们