Как ускорить использование multiprocessing/process_map и др. с тяжелыми вычислениями в Python (например, numpy)? - Цифровое Кемерово

Как ускорить использование multiprocessing/process_map и др. с тяжелыми вычислениями в Python (например, numpy)? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как ускорить использование multiprocessing/process_map и др. с тяжелыми вычислениями в Python (например, numpy)?

Цитата

Сообщение Anonymous » 05 дек 2023, 10:28

У меня есть функция, написанная на Numpy, каждый вызов которой занимает около 2 секунд, но мне приходится запускать ее десятки тысяч раз. Очевидно, что мне следует использовать многопоточность или многопроцессорность, и самый простой способ — использовать process_map или thread_map в tqdm.contrib.concurrent. Но я обнаружил, что это работает не так, как ожидалось.

Вот пример, который я проверил:

время импорта импортировать numpy как np из tqdm.auto импортировать tqdm из tqdm.contrib.concurrent импорта Process_map, thread_map def mydataset(размер, длина): для ii в диапазоне (длина): выход np.random.rand(*размер) защита расчет (мат): # симулируем тяжелые вычисления для ii в диапазоне (1000): avg = np.mean(mat) станд = np.std(мат) вернуть среднее, стандартное защита основной(): ds = список(mydataset((500,500), 100)) t0 = время.время() рез1 = [] для мата в tqdm(ds): res1.append(calc(mat)) print(f'for цикл: {time.time() - t0}s') t0 = время.время() res2 = список(карта(calc, tqdm(ds))) print(f'родная карта: {time.time() - t0}s') t0 = время.время() res3 = карта_процесса (расчет, дс) print(f'карта процесса: {time.time() - t0}s') t0 = время.время() res4 = thread_map(calc, ds) print(f'threadmap: {time.time() - t0}s') проходить если __name__ == '__main__': основной() И получилось:

100%|███████████████████████████████ ██████████████| 100/100 [00:51

Реклама

1701761314

Anonymous


У меня есть функция, написанная на Numpy, каждый вызов которой занимает около 2 секунд, но мне приходится запускать ее десятки тысяч раз. Очевидно, что мне следует использовать многопоточность или многопроцессорность, и самый простой способ — использовать process_map или thread_map в tqdm.contrib.concurrent. Но я обнаружил, что это работает не так, как ожидалось.
 
Вот пример, который я проверил:
 
время импорта импортировать numpy как np из tqdm.auto импортировать tqdm из tqdm.contrib.concurrent импорта Process_map, thread_map def mydataset(размер, длина):     для ii в диапазоне (длина):         выход np.random.rand(*размер) защита расчет (мат):     # симулируем тяжелые вычисления     для ii в диапазоне (1000):         avg = np.mean(mat)         станд = np.std(мат)     вернуть среднее, стандартное защита основной():     ds = список(mydataset((500,500), 100))     t0 = время.время()     рез1 = []     для мата в tqdm(ds):         res1.append(calc(mat))     print(f'for цикл: {time.time() - t0}s')     t0 = время.время()     res2 = список(карта(calc, tqdm(ds)))     print(f'родная карта: {time.time() - t0}s')     t0 = время.время()     res3 = карта_процесса (расчет, дс)     print(f'карта процесса: {time.time() - t0}s')     t0 = время.время()     res4 = thread_map(calc, ds)     print(f'threadmap: {time.time() - t0}s')     проходить если __name__ == '__main__':     основной()  И получилось:
 
100%|███████████████████████████████ ██████████████| 100/100 [00:51

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Process Process Process с более низким использованием процессора

Последнее сообщение Anonymous « 14 авг 2025, 10:51
Добавлено в форуме JAVA

Anonymous » 14 авг 2025, 10:51 » в форуме JAVA

My Java Process периодически отстает от 2025-08-14 09:36:10 до 2025-08-14 09:36:16.
Всегда отображается в случайное время.
В журнале VMStat показывает, что использование КПУ уменьшается, переключение потока уменьшается, и все это было...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
14 авг 2025, 10:51
Process Process Process с более низким использованием процессора

Последнее сообщение Anonymous « 14 авг 2025, 11:57
Добавлено в форуме JAVA

Anonymous » 14 авг 2025, 11:57 » в форуме JAVA

My Java Process периодически отстает, с 2025-08-14 09:36:10 до 2025-08-14 09:36:16. Он всегда отображается в случайное время.
Журнал VMStat показывает, что использование ЦП уменьшилось, переключение потока уменьшилось, и все прерывания были...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
14 авг 2025, 11:57
Python Multiprocessing.Process висит, когда в обоих процессах инициализируются крупные тензоры Pytorch

Последнее сообщение Anonymous « 20 фев 2025, 19:39
Добавлено в форуме Python

Anonymous » 20 фев 2025, 19:39 » в форуме Python

Почему код, показанный ниже, либо заканчивается нормально, либо висит в зависимости от того, какие строки комментируются/не построены, как описано в таблице ниже? Тенсоры в обоих процессах без использования «Spawn» , программа висит. Я могу...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 19:39
Python Multiprocessing Process PID отличается от фактического PID

Последнее сообщение Anonymous « 21 фев 2025, 17:08
Добавлено в форуме Python

Anonymous » 21 фев 2025, 17:08 » в форуме Python

Это мой код. Я пытаюсь создать N (= 10 здесь) процессы и просто пытаюсь увидеть их пиды. Когда я печатаю их и проверяю пид в терминале, они не одинаковы. РЕДАКТИРОВАТЬ: Я запускаю это на Mac (Yosemite), если это помогает.

for proc in xrange(10):...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
21 фев 2025, 17:08
Python Multiprocessing Process PID отличается от фактического PID

Последнее сообщение Anonymous « 21 июн 2025, 23:05
Добавлено в форуме Python

Anonymous » 21 июн 2025, 23:05 » в форуме Python

Это мой код. Я пытаюсь создать N (= 10 здесь) процессы и просто пытаюсь увидеть их пиды. Когда я печатаю их и проверяю пид в терминале, они не одинаковы. РЕДАКТИРОВАТЬ: Я запускаю это на Mac (Yosemite), если это помогает.

for proc in xrange(10):...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
21 июн 2025, 23:05

Вернуться в «Python»

Programmiererforum