Я работаю над некоторыми вычислениями на Python с использованием многопроцессорности (concurrent.futures), однако я заметил, что происходит некоторая утечка памяти. Похоже, что память, используемая подпроцессами, не освобождается после завершения вычислений подпроцесса, я приложил упрощенный пример. Я делаю что-то не так или это ошибка в Python? Я протестировал Python3.6 и Python3.8. Любое предложение о том, как его отладить, будет очень полезно, спасибо!
import os
import gc
import random
from concurrent.futures import ProcessPoolExecutor, as_completed
data_list = []
def _gen_rand_data(n1, n2):
global data_list
for _ in range(n1):
d = {}
for _ in range(n2):
d[str(random.randint(1e6, 1e12))+"87654321"] = str(random.randint(1e6, 1e16))+"12345678"
data_list.append(d)
def _compute_subprocess(j):
global data_list
set_j_sum = sum([int(x) for x in data_list[j].values()])
ret_list = []
for i in range(0, j):
overlap_key_sum = 0
for k, v in data_list.items():
if k in data_list[j]:
overlap_key_sum += int(v)
ret_list.append(overlap_key_sum/set_j_sum)
gc.collect()
return ret_list
def compute():
global data_list
_gen_rand_data(2000, 2000)
final_data = [[-1]*len(data_list) for _ in range(len(data_list))]
futures_dict = {}
finish_cnt = 0
with ProcessPoolExecutor(max_workers=os.cpu_count()) as ppe:
for j in range(1, len(data_list)):
futures_dict[ppe.submit(_compute_subprocess, j)] = j
for future in as_completed(futures_dict):
ret_list = future.result()
j = futures_dict[future]
for i in range(len(ret_list)):
final_data[j] = ret_list
finish_cnt += 1
print("{}/{}".format(finish_cnt, len(data_list)))
gc.collect()
return final_data
compute()
Как и предлагалось, я также пробовал многопроцессорность, код прилагается, проблема все равно та же.
import os
import gc
import random
from multiprocessing import Process, Queue, Pool
data_list = []
final_data = None
def _gen_rand_data(n1, n2):
global data_list
for _ in range(n1):
d = {}
for _ in range(n2):
d[str(random.randint(1e6, 1e12))+"87654321"] = str(random.randint(1e6, 1e16))+"12345678"
data_list.append(d)
def _compute_subprocess(j):
global data_list, final_data
set_j_sum = sum([int(x) for x in data_list[j].values()])
for i in range(0, j):
overlap_key_sum = 0
for k, v in data_list.items():
if k in data_list[j]:
overlap_key_sum += int(v)
final_data[j] = overlap_key_sum/set_j_sum
gc.collect()
def compute():
global data_list, final_data
_gen_rand_data(2000, 2000)
# _gen_rand_data(10, 10)
final_data = [[-1]*len(data_list) for _ in range(len(data_list))]
finish_cnt = 0
proc_list = []
with Pool() as pool:
pool.map(_compute_subprocess, iterable=range(1, len(data_list)))
print(len(final_data))
compute()
Подробнее здесь: https://stackoverflow.com/questions/590 ... processing
Утечка памяти Python при многопроцессорной обработке ⇐ Python
Программы на Python
1737653608
Гость
Я работаю над некоторыми вычислениями на Python с использованием многопроцессорности (concurrent.futures), однако я заметил, что происходит некоторая утечка памяти. Похоже, что память, используемая подпроцессами, не освобождается после завершения вычислений подпроцесса, я приложил упрощенный пример. Я делаю что-то не так или это ошибка в Python? Я протестировал Python3.6 и Python3.8. Любое предложение о том, как его отладить, будет очень полезно, спасибо!
import os
import gc
import random
from concurrent.futures import ProcessPoolExecutor, as_completed
data_list = []
def _gen_rand_data(n1, n2):
global data_list
for _ in range(n1):
d = {}
for _ in range(n2):
d[str(random.randint(1e6, 1e12))+"87654321"] = str(random.randint(1e6, 1e16))+"12345678"
data_list.append(d)
def _compute_subprocess(j):
global data_list
set_j_sum = sum([int(x) for x in data_list[j].values()])
ret_list = []
for i in range(0, j):
overlap_key_sum = 0
for k, v in data_list[i].items():
if k in data_list[j]:
overlap_key_sum += int(v)
ret_list.append(overlap_key_sum/set_j_sum)
gc.collect()
return ret_list
def compute():
global data_list
_gen_rand_data(2000, 2000)
final_data = [[-1]*len(data_list) for _ in range(len(data_list))]
futures_dict = {}
finish_cnt = 0
with ProcessPoolExecutor(max_workers=os.cpu_count()) as ppe:
for j in range(1, len(data_list)):
futures_dict[ppe.submit(_compute_subprocess, j)] = j
for future in as_completed(futures_dict):
ret_list = future.result()
j = futures_dict[future]
for i in range(len(ret_list)):
final_data[i][j] = ret_list[i]
finish_cnt += 1
print("{}/{}".format(finish_cnt, len(data_list)))
gc.collect()
return final_data
compute()
Как и предлагалось, я также пробовал многопроцессорность, код прилагается, проблема все равно та же.
import os
import gc
import random
from multiprocessing import Process, Queue, Pool
data_list = []
final_data = None
def _gen_rand_data(n1, n2):
global data_list
for _ in range(n1):
d = {}
for _ in range(n2):
d[str(random.randint(1e6, 1e12))+"87654321"] = str(random.randint(1e6, 1e16))+"12345678"
data_list.append(d)
def _compute_subprocess(j):
global data_list, final_data
set_j_sum = sum([int(x) for x in data_list[j].values()])
for i in range(0, j):
overlap_key_sum = 0
for k, v in data_list[i].items():
if k in data_list[j]:
overlap_key_sum += int(v)
final_data[i][j] = overlap_key_sum/set_j_sum
gc.collect()
def compute():
global data_list, final_data
_gen_rand_data(2000, 2000)
# _gen_rand_data(10, 10)
final_data = [[-1]*len(data_list) for _ in range(len(data_list))]
finish_cnt = 0
proc_list = []
with Pool() as pool:
pool.map(_compute_subprocess, iterable=range(1, len(data_list)))
print(len(final_data))
compute()
Подробнее здесь: [url]https://stackoverflow.com/questions/59014776/python-memory-leakage-in-multiprocessing[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия