Многопроцессорная обработка с пакетной обработкой

Многопроцессорная обработка с пакетной обработкой ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Многопроцессорная обработка с пакетной обработкой

Цитата

Сообщение Anonymous » 31 окт 2024, 00:10

Мне бы хотелось использовать многопроцессорность, чтобы ускорить работу программы. Мой входной файл содержит 30 миллионов строк. Я бы хотел запустить 10 процессов параллельно. Но мой файл очень большой (содержит 30 миллионов строк). Боюсь, что бегущая память взорвется. Кто-нибудь знает, что мне делать? Ниже приведен код, который выполняется в одном процессе. Заранее спасибо.
batch_size = 1000
header_written = False
output_file = "final_patent_sample.csv"
for i in tqdm(range(0, df2_csv.shape[0], batch_size)):
batch = df2_csv.iloc[i:i + batch_size].to_dict(orient='records')
results = match_and_merge(batch)
batch_df = pd.DataFrame(results, columns=matched_df.columns)
batch_df.to_csv(output_file, mode='a', index=False, header=not header_written)
header_written = True

Подробнее здесь: https://stackoverflow.com/questions/791 ... h-batching

1730322610

Anonymous

Мне бы хотелось использовать многопроцессорность, чтобы ускорить работу программы. Мой входной файл содержит 30 миллионов строк. Я бы хотел запустить 10 процессов параллельно. Но мой файл очень большой (содержит 30 миллионов строк). Боюсь, что бегущая память взорвется. Кто-нибудь знает, что мне делать? Ниже приведен код, который выполняется в одном процессе. Заранее спасибо.
batch_size = 1000
header_written = False
output_file = "final_patent_sample.csv"
for i in tqdm(range(0, df2_csv.shape[0], batch_size)):
batch = df2_csv.iloc[i:i + batch_size].to_dict(orient='records')
results = match_and_merge(batch)
batch_df = pd.DataFrame(results, columns=matched_df.columns)
batch_df.to_csv(output_file, mode='a', index=False, header=not header_written)
header_written = True
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79139568/multiprocessing-with-batching[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Многопроцессорная обработка с пакетной обработкой

Последнее сообщение Anonymous « 30 окт 2024, 06:16
Добавлено в форуме Python

Anonymous » 30 окт 2024, 06:16 » в форуме Python

Я хочу реализовать многопроцессорную обработку с помощью пакетной обработки. Я хочу, чтобы одна обработка обрабатывала один размер пакета. Как мне изменить свой код?
batch_size = 1000
header_written = False
output_file = final_patent_sample.csv
for...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 06:16
Многопроцессорная обработка с пакетной обработкой

Последнее сообщение Anonymous « 30 окт 2024, 21:40
Добавлено в форуме Python

Anonymous » 30 окт 2024, 21:40 » в форуме Python

Мне бы хотелось использовать многопроцессорность, чтобы ускорить работу программы. Мой входной файл содержит 30 миллионов строк. Я бы хотел запустить 10 процессов параллельно. Но мой файл очень большой (содержит 30 миллионов строк). Боюсь, что...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 21:40
Многопроцессорная обработка с пакетной обработкой

Последнее сообщение Anonymous « 31 окт 2024, 13:25
Добавлено в форуме Python

Anonymous » 31 окт 2024, 13:25 » в форуме Python

Мне бы хотелось использовать многопроцессорность, чтобы ускорить работу программы. Мой входной файл содержит 30 миллионов строк. Я бы хотел запустить 10 процессов параллельно. Но мой файл очень большой (содержит 30 миллионов строк). Боюсь, что...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
31 окт 2024, 13:25
Многопроцессорная обработка Python занимает значительно больше времени, чем последовательная обработка с использованием

Последнее сообщение Anonymous « 19 ноя 2024, 19:09
Добавлено в форуме Python

Anonymous » 19 ноя 2024, 19:09 » в форуме Python

Я пытаюсь сравнить эффективность модуля многопроцессорной обработки в Python, выполняя задачу с интенсивным использованием ЦП.
Последовательная задача:
import multiprocessing
import time

v1 = * 5000000
v2 = * 5000000

def worker1(nums):
global v1...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
19 ноя 2024, 19:09
Java 8 Stream с пакетной обработкой

Последнее сообщение Anonymous « 27 май 2024, 23:52
Добавлено в форуме JAVA

Anonymous » 27 май 2024, 23:52 » в форуме JAVA

У меня есть большой файл, содержащий список элементов.

Я хотел бы создать пакет элементов, сделать HTTP-запрос с этим пакетом (все элементы необходимы в качестве параметров в HTTP-запросе). Я могу сделать это очень легко с помощью цикла for, но,...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
27 май 2024, 23:52

Вернуться в «Python»