Почему я должен передавать функцию с помощью инициализатора, и могу ли я использовать общую память вместо этого? - Цифровое Кемерово

Почему я должен передавать функцию с помощью инициализатора, и могу ли я использовать общую память вместо этого? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему я должен передавать функцию с помощью инициализатора, и могу ли я использовать общую память вместо этого?

Цитата

Сообщение Anonymous » 09 фев 2025, 20:05

Возьмите это MWE: < /p>

Код: Выделить всё

from multiprocessing import Pool
from time import perf_counter as now
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Simplified parallel execution without partial"""
num_cores = num_cores

task_args = [(idx, val) for idx, val in enumerate(tasks)]
start = now()
global f
f = make_func()
print(f"************** {now() - start} seconds to make f")
start = now()
with Pool(num_cores) as pool:
results = pool.map( self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)

Я объявил f глобальным. Я думаю, что это означает, что в каждом работнике будет сделана копия большого массива Numpy.

Код: Выделить всё

from multiprocessing import Pool
from time import perf_counter as now
import time
import os
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

def init_worker():
global f
f = make_func()

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Parallel execution with proper initialization"""
num_cores = num_cores or len(os.sched_getaffinity(0))
task_args = [(idx, val) for idx, val in enumerate(tasks)]

start = now()
with Pool(num_cores, initializer=init_worker) as pool:
results = pool.map(self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)
< /code>
Мне сказали, что это лучший стиль, но я не вижу, что такое преимущество.  Я не уверен, почему f

должен быть объявлен глобальным в `init_worker. В любом случае копия большого массива Numpy все еще отправляется каждому работнику. В целом это также кажется медленнее. < /P>
Я использую Linux. < /P>

В идеале я хотел бы не делать Копия массива у каждого работника. Есть ли быстрый способ использовать общую память, чтобы избежать этого?

Подробнее здесь: https://stackoverflow.com/questions/794 ... mory-inste

Реклама

1739120744

Anonymous

 Возьмите это MWE: < /p>
[code]from multiprocessing import Pool
from time import perf_counter as now
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Simplified parallel execution without partial"""
num_cores = num_cores

task_args = [(idx, val) for idx, val in enumerate(tasks)]
start = now()
global f
f = make_func()
print(f"************** {now() - start} seconds to make f")
start = now()
with Pool(num_cores) as pool:
results = pool.map( self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)
[/code]
Я объявил f  глобальным. Я думаю, что это означает, что в каждом работнике будет сделана копия большого массива Numpy.[code]from multiprocessing import Pool
from time import perf_counter as now
import time
import os
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M[x, x] + M[y, y]

def init_worker():
global f
f = make_func()

class ParallelProcessor:
def __init__(self):
pass

def process_task(self, args):
"""Unpack arguments internally"""
index, integer_arg = args
print(f(index, integer_arg))

def run_parallel(self, tasks, num_cores=None):
"""Parallel execution with proper initialization"""
num_cores = num_cores or len(os.sched_getaffinity(0))
task_args = [(idx, val) for idx, val in enumerate(tasks)]

start = now()
with Pool(num_cores, initializer=init_worker) as pool:
results = pool.map(self.process_task, task_args)
print(f"************** {now() - start} seconds to run all jobs")
return results

if __name__ == "__main__":
processor = ParallelProcessor()
processor.run_parallel(tasks=[1, 2, 3, 4, 5], num_cores=2)
< /code>
Мне сказали, что это лучший стиль, но я не вижу, что такое преимущество.  Я не уверен, почему f [/code] должен быть объявлен глобальным в `init_worker. В любом случае копия большого массива Numpy все еще отправляется каждому работнику. В целом это также кажется медленнее. < /P>
Я использую Linux. < /P>

В идеале я хотел бы не делать Копия массива у каждого работника. Есть ли быстрый способ использовать общую память, чтобы избежать этого?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79425204/why-should-i-pass-a-function-using-initializer-and-can-i-use-shared-memory-inste[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему я должен передавать функцию с помощью инициализатора, и могу ли я использовать общую память вместо этого?

Последнее сообщение Anonymous « 10 фев 2025, 12:01
Добавлено в форуме Python

Anonymous » 10 фев 2025, 12:01 » в форуме Python

Возьмите это MWE:
from multiprocessing import Pool
from time import perf_counter as now
import numpy as np

def make_func():
n = 20000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M + M

class ParallelProcessor:
def...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
10 фев 2025, 12:01
Почему я должен проходить функцию с помощью инициализатора, когда она в любом случае глобальна?

Последнее сообщение Anonymous « 09 фев 2025, 19:01
Добавлено в форуме Python

Anonymous » 09 фев 2025, 19:01 » в форуме Python

Возьмите это MWE:
from multiprocessing import Pool
from time import perf_counter as now
import numpy as np

def make_func():
n = 10000
np.random.seed(7)
M = np.random.rand(n, n)
return lambda x, y: M + M

class ParallelProcessor:
def...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
09 фев 2025, 19:01
Ошибка C++: «Массив должен быть инициализирован с помощью инициализатора, заключенного в скобки»

Последнее сообщение Anonymous « 12 дек 2024, 22:34
Добавлено в форуме C++

Anonymous » 12 дек 2024, 22:34 » в форуме C++

Я получаю следующую ошибку C++:

array must be initialized with a brace enclosed initializer

Из этой линии C++

int cipher = 0;

В чем здесь проблема? Что означает ошибка? Ниже приведен полный код:

string decryption(string todecrypt)
{
int...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 22:34
Передавать или не передавать модель представления в составной элемент

Последнее сообщение Anonymous « 22 окт 2024, 12:11
Добавлено в форуме Android

Anonymous » 22 окт 2024, 12:11 » в форуме Android

Согласно примеру архитектуры Goggles, они используют модель представления в качестве входной переменной для Composable.
@OptIn(ExperimentalLifecycleComposeApi::class)
@Composable
fun TaskDetailScreen(
onEditTask: (String) -> Unit,
onBack: () ->...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
22 окт 2024, 12:11
(MacBook M1): поднять ImportError («Невозможно найти общую библиотеку zbar») ImportError: невозможно найти общую библиот

Последнее сообщение Anonymous « 05 дек 2023, 11:43
Добавлено в форуме Python

Anonymous » 05 дек 2023, 11:43 » в форуме Python

Mac OS X:

brew install zbar Установите эту оболочку Python; используйте вторую форму для установки зависимостей сценариев командной строки:

pip install pyzbar Я попробовал выполнить эти действия, но все равно получаю сообщение об ошибке
Файл...

0 Ответы

115 Просмотры

Последнее сообщение Anonymous
05 дек 2023, 11:43

Вернуться в «Python»

Programmiererforum