Почему многопроцессорная обработка Python с использованием функций класса для этого кода выполняется медленнее, чем посл

Почему многопроцессорная обработка Python с использованием функций класса для этого кода выполняется медленнее, чем посл ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Почему многопроцессорная обработка Python с использованием функций класса для этого кода выполняется медленнее, чем посл

Цитата

Сообщение Anonymous » 17 окт 2024, 14:14

Я пытаюсь запустить многопроцессорный пул внутри класса для вычисления нескольких значений, использующих функции класса гораздо большего класса. Я пытаюсь взять начальные значения, добавить случайное 5%-ное нормальное распределение к каждому значению и вычислить новую логарифмическую вероятность этих новых значений.
Вот (несколько бесполезный) фрагмент код, который я использую. make_model очень длинный, но выдает модель скорости, которую я сравниваю с измеренными значениями, хранящимися в контейнере данных.

Код: Выделить всё

import multiprocessing as mp

class fit_time_dependent():
def __init__(self):
setup a bunch of things here

def make_model(self):
a bunch of things here too
return velocity_model

def log_likelihood_pass1(self,pars):
velocity_model = self.make_model(pars)

totallogprob = 0
if self.datum.velocities:
for inst in self.datum.velocity_instruments:

vsh_data = self.datum.get_velocity(inst)
vsh_data_y = vsh_data["vsh"]*u.km/u.s
vsh_data_y_err = vsh_data["vsh_err"]*u.km/u.s

sigma2 = vsh_data_y_err ** 2# + model ** 2
totallogprob += -0.5 * np.sum((vsh_data_y - velocity_model)**2/sigma2)

return totallogprob.value

def log_prob_pass1(self,pars):
lp = self.log_prior(pars)
if not np.isfinite(lp):
return -np.inf
return lp + self.log_likelihood_pass1(pars)

def do_fit(self)

p0 = some initial values from a previous fit of model to data

nsize = 128
spread = 0.05
pos = np.array(p0) + spread * np.random.randn(nsize, len(p0))

time_start_pool = time_counter.time()
pool = mp.Pool(8)
results_pool = pool.map(self.log_prob_pass1,pos)
time_end_pool = time_counter.time()
time_elapsed_pool = float(time_end_pool) - float(time_start_pool)
print("Pool - map - %s seconds" % time_elapsed_pool)

time_start_serial = time_counter.time()
results_serial = np.asarray(list(map(self.log_prob_pass1,pos)))
time_end_serial = time_counter.time()
time_elapsed_serial = float(time_end_serial) - float(time_start_serial)
print("Serial - map - %s seconds" % time_elapsed_serial)

Проблема в том, что этот расчет приходится повторять много раз, а выполнение на одном ядре займет слишком много времени.
При тестировании кода в пуле против последовательного порта я получаю огромное снижение производительности при использовании пула.

Код: Выделить всё

Pool - map - 296.5006010532379 seconds
Serial - map - 17.647610187530518 seconds

Кроме того, я следил за загрузкой ЦП и обнаружил, что пул не использует ни одно из ядер, которые я запросил в пуле:
Использование ЦП
Я пытался использовать pathos/multiprocess с различными параметрами пула, такими как ProcessPool, ParallelPool, ThreadPool. Я хотел бы сохранить простоту и не использовать Process, но если до этого дойдет, то все в порядке.
Это похоже на мою проблему, но не совсем: https:// stackoverflow.com/questions/66790158/how-to-make-use-of-a-multiprocessing-manager-within-a-class
Спасибо за помощь.

Подробнее здесь: https://stackoverflow.com/questions/790 ... -serial-fo

1729163699

Anonymous

Я пытаюсь запустить многопроцессорный пул внутри класса для вычисления нескольких значений, использующих функции класса гораздо большего класса. Я пытаюсь взять начальные значения, добавить случайное 5%-ное нормальное распределение к каждому значению и вычислить новую логарифмическую вероятность этих новых значений.
Вот (несколько бесполезный) фрагмент код, который я использую.  make_model очень длинный, но выдает модель скорости, которую я сравниваю с измеренными значениями, хранящимися в контейнере данных.
[code]import multiprocessing as mp

class fit_time_dependent():
def __init__(self):
setup a bunch of things here

def make_model(self):
a bunch of things here too
return velocity_model

def log_likelihood_pass1(self,pars):
velocity_model = self.make_model(pars)

totallogprob = 0
if self.datum.velocities:
for inst in self.datum.velocity_instruments:

vsh_data = self.datum.get_velocity(inst)
vsh_data_y = vsh_data["vsh"]*u.km/u.s
vsh_data_y_err = vsh_data["vsh_err"]*u.km/u.s

sigma2 = vsh_data_y_err ** 2# + model ** 2
totallogprob += -0.5 * np.sum((vsh_data_y - velocity_model)**2/sigma2)

return totallogprob.value

def log_prob_pass1(self,pars):
lp = self.log_prior(pars)
if not np.isfinite(lp):
return -np.inf
return lp + self.log_likelihood_pass1(pars)

def do_fit(self)

p0 = some initial values from a previous fit of model to data

nsize = 128
spread = 0.05
pos = np.array(p0) + spread * np.random.randn(nsize, len(p0))

time_start_pool = time_counter.time()
pool = mp.Pool(8)
results_pool = pool.map(self.log_prob_pass1,pos)
time_end_pool = time_counter.time()
time_elapsed_pool = float(time_end_pool) - float(time_start_pool)
print("Pool - map - %s seconds" % time_elapsed_pool)

time_start_serial = time_counter.time()
results_serial = np.asarray(list(map(self.log_prob_pass1,pos)))
time_end_serial = time_counter.time()
time_elapsed_serial = float(time_end_serial) - float(time_start_serial)
print("Serial - map - %s seconds" % time_elapsed_serial)
[/code]
Проблема в том, что этот расчет приходится повторять много раз, а выполнение на одном ядре займет слишком много времени.
При тестировании кода в пуле против последовательного порта я получаю огромное снижение производительности при использовании пула.
[code]Pool - map - 296.5006010532379 seconds
Serial - map - 17.647610187530518 seconds
[/code]
Кроме того, я следил за загрузкой ЦП и обнаружил, что пул не использует ни одно из ядер, которые я запросил в пуле:
Использование ЦП
Я пытался использовать pathos/multiprocess с различными параметрами пула, такими как ProcessPool, ParallelPool, ThreadPool.  Я хотел бы сохранить простоту и не использовать Process, но если до этого дойдет, то все в порядке.
Это похоже на мою проблему, но не совсем: https:// stackoverflow.com/questions/66790158/how-to-make-use-of-a-multiprocessing-manager-within-a-class
Спасибо за помощь. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79096668/why-is-the-python-mulitprocessing-using-class-functions-slower-than-in-serial-fo[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему многопроцессорная обработка Python с использованием функций класса для этого кода выполняется медленнее, чем посл

Последнее сообщение Anonymous « 17 окт 2024, 09:00
Добавлено в форуме Python

Anonymous » 17 окт 2024, 09:00 » в форуме Python

Я пытаюсь запустить многопроцессорный пул внутри класса для вычисления нескольких значений, использующих функции класса гораздо большего класса. Я пытаюсь взять начальные значения, добавить случайное 5%-ное нормальное распределение к каждому...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 09:00
Многопроцессорная обработка Python занимает значительно больше времени, чем последовательная обработка с использованием

Последнее сообщение Anonymous « 19 ноя 2024, 19:09
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 19:09 » в форуме Python

Я пытаюсь сравнить эффективность модуля многопроцессорной обработки в Python, выполняя задачу с интенсивным использованием ЦП.
Последовательная задача:
import multiprocessing
import time

v1 = * 5000000
v2 = * 5000000

def worker1(nums):
global v1...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 19:09
Как инициализировать экран, чтобы проверить, вошел ли пользователь в систему с использованием базы данных помещений посл

Последнее сообщение Anonymous « 12 май 2024, 11:32
Добавлено в форуме Android

Anonymous » 12 май 2024, 11:32 » в форуме Android

Такова моя логика. В моей модели loginViewModel у меня будет функция аутентификации, которая в основном извлекает пользователя из базы данных и проверяет, соответствует ли он вводу из текстового поля. У меня будет еще одна функция для выхода...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
12 май 2024, 11:32
Многопроцессорная обработка с помощью граммформера

Последнее сообщение Anonymous « 03 июл 2024, 12:36
Добавлено в форуме Python

Anonymous » 03 июл 2024, 12:36 » в форуме Python

Я пытаюсь реализовать многопроцессорную обработку с помощью gramformer, модели с открытым исходным кодом для исправления грамматических ошибок. Я пробовал несколько подходов, но продолжаю получать ошибки, которые невозможно мариновать. я также...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 12:36
Многопроцессорная обработка с пакетной обработкой

Последнее сообщение Anonymous « 30 окт 2024, 06:16
Добавлено в форуме Python

Anonymous » 30 окт 2024, 06:16 » в форуме Python

Я хочу реализовать многопроцессорную обработку с помощью пакетной обработки. Я хочу, чтобы одна обработка обрабатывала один размер пакета. Как мне изменить свой код?
batch_size = 1000
header_written = False
output_file = final_patent_sample.csv
for...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 06:16

Вернуться в «Python»