Python Multiprocessing на генераторе, который считывает файлы в

Python Multiprocessing на генераторе, который считывает файлы в ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Python Multiprocessing на генераторе, который считывает файлы в

Цитата

Сообщение Anonymous » 10 июл 2025, 19:30

Я пытаюсь прочитать и обработать 1000 файлов, но, к сожалению, требуется около 3 раза, чтобы обработать файл, как и для чтения его с диска, поэтому я хотел бы обработать эти файлы, как они читаются (и, хотя я продолжаю читать в дополнительных файлах). < /p>

В идеальном мире у меня есть генератор, который считывает по одному файлу за раз, и я хотел бы передать этот генератор в пул работников, которые обрабатывают элементы из генератора, поскольку они (медленно) сгенерируются.def process_file(file_string):
...
return processed_file

pool = Pool(processes=4)
path = 'some/path/'
results = pool.map(process_file, (open(path+part,'rb').read() for part in os.listdir(path)))
< /code>

Единственная проблема с кодом выше заключается в том, что все файлы читаются в память до начала пула, что означает, что мне нужно ждать диска, чтобы прочитать все, и я также потребляю большое количество памяти.

Подробнее здесь: https://stackoverflow.com/questions/341 ... s-files-in

1752165016

Anonymous

 Я пытаюсь прочитать и обработать 1000 файлов, но, к сожалению, требуется около 3 раза, чтобы обработать файл, как и для чтения его с диска, поэтому я хотел бы обработать эти файлы, как они читаются (и, хотя я продолжаю читать в дополнительных файлах). < /p>

В идеальном мире у меня есть генератор, который считывает по одному файлу за раз, и я хотел бы передать этот генератор в пул работников, которые обрабатывают элементы из генератора, поскольку они (медленно) сгенерируются.def process_file(file_string):
...
return processed_file

pool = Pool(processes=4)
path = 'some/path/'
results = pool.map(process_file, (open(path+part,'rb').read() for part in os.listdir(path)))
< /code>

Единственная проблема с кодом выше заключается в том, что все файлы читаются в память до начала пула, что означает, что мне нужно ждать диска, чтобы прочитать все, и я также потребляю большое количество памяти.  

Подробнее здесь: [url]https://stackoverflow.com/questions/34143397/python-multiprocessing-on-a-generator-that-reads-files-in[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Развертывание приложения DASH для рендеринга, которое считывает большие файлы Excel: сбой при запуске, когда файлы нет.

Последнее сообщение Anonymous « 20 авг 2025, 09:35
Добавлено в форуме Python

Anonymous » 20 авг 2025, 09:35 » в форуме Python

У меня есть код, который работает локально и получает много данных от Excels.
Я пытаюсь отображать его с помощью GitHub, а затем с помощью render.com. /> Я добавил охранников, чтобы приложение могло начинать с пустых данных данных (по умолчанию с...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
20 авг 2025, 09:35
Как просмотреть один элемент вперед (заглянуть) в генераторе Python?

Последнее сообщение Anonymous « 02 авг 2024, 12:44
Добавлено в форуме Python

Anonymous » 02 авг 2024, 12:44 » в форуме Python

Я не могу понять, как просмотреть один элемент вперед в генераторе Python. Как только я смотрю, его уже нет.
Вот что я имею в виду:
gen = iter( )
next_value = gen.next() # okay, I looked forward and see that next_value = 1
# but now:
list(gen) # is...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
02 авг 2024, 12:44
Как обеспечить согласованное перетасовывание X_train и y_train в генераторе данных Keras в функции on_epoch_end()?

Последнее сообщение Anonymous « 29 фев 2024, 18:47
Добавлено в форуме Python

Anonymous » 29 фев 2024, 18:47 » в форуме Python

Я пытаюсь реализовать класс генератора данных keras. Одним из атрибутов является shuffle, который, если он установлен в true при инициализации класса и вызове on_epoch_end(), будет перетасовывать индексы образцов в матрице дизайна. , который в нашем...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
29 фев 2024, 18:47
Как получить доступ к синтаксическому дереву, созданному в другом файле в генераторе исходного кода C#?

Последнее сообщение Anonymous « 29 фев 2024, 19:51
Добавлено в форуме C#

Anonymous » 29 фев 2024, 19:51 » в форуме C#

Я пишу генератор исходного кода на C#. Сначала я получаю нужный мне класс, который нахожу с помощью атрибута. Затем мне нужно найти класс, который находится в другом файле. Но я не могу его найти.

Мой код слишком длинный, чтобы его можно было...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
29 фев 2024, 19:51
Как получить тип типа атрибута в генераторе кода Roslyn?

Последнее сообщение Anonymous « 23 июн 2024, 19:36
Добавлено в форуме C#

Anonymous » 23 июн 2024, 19:36 » в форуме C#

У меня есть запись и атрибут Map(Type C, Type D) следующим образом:

public record MyRecord{}

Где-то в генераторе кода Roslyn я хотел бы получить тип типа A или C.
Как?
У меня есть такой генератор кода Roslyn:
public void...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
23 июн 2024, 19:36

Вернуться в «Python»