Как использовать concurrent.futures в кадре данных Pandas с функцией Apply? - Цифровое Кемерово

Как использовать concurrent.futures в кадре данных Pandas с функцией Apply? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как использовать concurrent.futures в кадре данных Pandas с функцией Apply?

Цитата

Сообщение Anonymous » 23 сен 2024, 10:34

Я пытался распараллелить свой код и потратил некоторое время на изучение Dask, Pandarallel, но по той или иной причине они не сработали, поэтому сейчас я рассматриваю возможность реализации concurrent.futures.
Вот как выглядит моя формулировка проблемы:

1)def do_stuff( (self.param1, self.param2) , abs(self.param3) ):
значение = многошаговое уравнение self.param1, self.param2,
self.param3 (это занимает более 2–5 минут на каждую строку)

возвращаемое значение.
2)df['value'] = df.apply(lambda row: do_stuff((self.param1,
self.param2) , abs(self.param3)) , axis =1)

Поскольку мой df имеет более 1500 строк, и обработка каждой строки занимает около 2 минут за одну core, я считаю, что многопроцессорная обработка принесет мне пользу. Я начинаю понимать, как работают пул и ProcessPoolExecutor, но застрял в синтаксисе использования df.apply с многопроцессорной обработкой. Я просмотрел примеры в Интернете, но не смог найти ни одного, связанного с функцией применения с использованием фрейма данных.

Код: Выделить всё

with ThreadPoolExecutor(max_workers=1) as executor:
future = executor.submit(pow, 323, 1235) ------> modify this line to process a df.apply

write back the result to a df.

Может ли кто-нибудь помочь мне с простым синтаксисом или указать правильное направление? Я очень ценю это!

Подробнее здесь: https://stackoverflow.com/questions/756 ... y-function

Реклама

1727076895

Anonymous

Я пытался распараллелить свой код и потратил некоторое время на изучение Dask, Pandarallel, но по той или иной причине они не сработали, поэтому сейчас я рассматриваю возможность реализации concurrent.futures.
Вот как выглядит моя формулировка проблемы:

1)def do_stuff( (self.param1, self.param2) , abs(self.param3) ):
значение = многошаговое уравнение self.param1, self.param2,
self.param3 (это занимает более 2–5 минут на каждую строку)

возвращаемое значение.
2)df['value'] = df.apply(lambda row: do_stuff((self.param1,
self.param2) , abs(self.param3)) , axis =1)

Поскольку мой df имеет более 1500 строк, и обработка каждой строки занимает около 2 минут за одну core, я считаю, что многопроцессорная обработка принесет мне пользу. Я начинаю понимать, как работают пул и ProcessPoolExecutor, но застрял в синтаксисе использования df.apply с многопроцессорной обработкой. Я просмотрел примеры в Интернете, но не смог найти ни одного, связанного с функцией применения с использованием фрейма данных.
[code]with ThreadPoolExecutor(max_workers=1) as executor:
future = executor.submit(pow, 323, 1235) ------> modify this line to process a df.apply

write back the result to a df.
[/code]
Может ли кто-нибудь помочь мне с простым синтаксисом или указать правильное направление? Я очень ценю это! 

Подробнее здесь: [url]https://stackoverflow.com/questions/75657443/how-to-use-concurrent-futures-in-a-pandas-dataframe-with-the-apply-function[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Должен ли я использовать ВСЕ виртуальные ядра при использовании Python Concurrent Futures?

Последнее сообщение Anonymous « 15 июл 2024, 08:48
Добавлено в форуме Python

Anonymous » 15 июл 2024, 08:48 » в форуме Python

Безопасно ли при использовании Python Concurrent Futures использовать ВСЕ виртуальные ядра, доступные на машине?
В настоящее время мой код использует доступные виртуальные ядра минус 1 как Я хочу оставить одно виртуальное ядро «свободным» для...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
15 июл 2024, 08:48
Python пытается использовать concurrent.futures для потока

Последнее сообщение Anonymous « 27 авг 2025, 14:14
Добавлено в форуме Python

Anonymous » 27 авг 2025, 14:14 » в форуме Python

Я использую Python для небольшого сценария и не намного больше, и никогда не играл с потоком, поэтому извиняюсь за то, что, вероятно, будет основными вопросами. Потребуется 10 минут или около того, чтобы скопировать прошивку каждому контроллеру,...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
27 авг 2025, 14:14
Проблемы со сбором всех тиковых данных с помощью Concurrent.futures в Python

Последнее сообщение Anonymous « 13 июл 2024, 15:49
Добавлено в форуме Python

Anonymous » 13 июл 2024, 15:49 » в форуме Python

Я разрабатываю программу для вставки данных на уровне тиков для более чем 300 акций, полученных в формате словаря веб-потока от API брокера. У меня успешно работает версия программы без concurrent.futures, но она пропускает некоторые тики из-за...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
13 июл 2024, 15:49
Опасен ли вызов concurrent.futures.ThreadPoolExecutor в конечной точке FastAPI?

Последнее сообщение Anonymous « 04 май 2024, 08:29
Добавлено в форуме Python

Anonymous » 04 май 2024, 08:29 » в форуме Python

У меня есть следующий тестовый код:
import concurrent.futures
import urllib.request

URLS =

# Retrieve a single page and report the URL and contents
def load_url(url, timeout):
with urllib.request.urlopen(url, timeout=timeout) as conn:
return...

0 Ответы

37 Просмотры

Последнее сообщение Anonymous
04 май 2024, 08:29
Как исправить DeprecationWarning, когда concurrent.futures с multiprocessing.Process используются вместе?

Последнее сообщение Anonymous « 21 май 2024, 19:09
Добавлено в форуме Linux

Anonymous » 21 май 2024, 19:09 » в форуме Linux

Как исправить предупреждение об устаревании в следующем примере pytest? Обратите внимание, что это минималистичный воспроизводитель.
Сценарий использования довольно прост:

У меня есть объект (представленный как Obj ), который проверен;
Obj...

0 Ответы

58 Просмотры

Последнее сообщение Anonymous
21 май 2024, 19:09

Вернуться в «Python»

Programmiererforum