Как эффективно распараллелить прогнозирование временных рядов с помощью Dask? - Цифровое Кемерово

Как эффективно распараллелить прогнозирование временных рядов с помощью Dask? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как эффективно распараллелить прогнозирование временных рядов с помощью Dask?

Цитата

Сообщение Anonymous » 17 окт 2024, 12:21

Я пытаюсь распараллелить прогнозирование временных рядов в Python с помощью dask. Формат данных таков, что каждый временной ряд представляет собой столбец и имеет общий индекс ежемесячных дат. У меня есть пользовательская функция прогнозирования, которая возвращает объект временного ряда с подобранными и прогнозируемыми значениями. Я хочу применить эту функцию ко всем столбцам фрейма данных (все временные ряды) и вернуть новый фрейм данных со всеми этими сериями для загрузки в БД.
Я заставил код работать, запустив:

Код: Выделить всё

data = pandas_df.copy()
ddata = dd.from_pandas(data, npartitions=1)
res = ddata.map_partitions(lambda df: df.apply(forecast_func,
axis=0)).compute(get=dask.multiprocessing.get)

Мой вопрос: есть ли в Dask способ разделения по столбцу, а не по строке, поскольку в этом случае мне нужно сохранить упорядоченный индекс времени, как для функция прогнозирования работает правильно.

Если нет, то как мне переформатировать данные, чтобы сделать возможным эффективное крупномасштабное прогнозирование и при этом возвращать данные в формат, который мне нужно затем отправить в БД?

пример формата данных

Подробнее здесь: https://stackoverflow.com/questions/494 ... using-dask

Реклама

1729156905

Anonymous

Я пытаюсь распараллелить прогнозирование временных рядов в Python с помощью dask. Формат данных таков, что каждый временной ряд представляет собой столбец и имеет общий индекс ежемесячных дат. У меня есть пользовательская функция прогнозирования, которая возвращает объект временного ряда с подобранными и прогнозируемыми значениями. Я хочу применить эту функцию ко всем столбцам фрейма данных (все временные ряды) и вернуть новый фрейм данных со всеми этими сериями для загрузки в БД.
Я заставил код работать, запустив:

[code]data = pandas_df.copy()
ddata = dd.from_pandas(data, npartitions=1)
res = ddata.map_partitions(lambda df: df.apply(forecast_func,
axis=0)).compute(get=dask.multiprocessing.get)
[/code]

Мой вопрос: есть ли в Dask способ разделения по столбцу, а не по строке, поскольку в этом случае мне нужно сохранить упорядоченный индекс времени, как для функция прогнозирования работает правильно.

Если нет, то как мне переформатировать данные, чтобы сделать возможным эффективное крупномасштабное прогнозирование и при этом возвращать данные в формат, который мне нужно затем отправить в БД?

пример формата данных 

Подробнее здесь: [url]https://stackoverflow.com/questions/49416980/how-to-efficiently-parallelize-time-series-forecasting-using-dask[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Классификация временных рядов с использованием запаздывающих данных и экзогенных переменных временных рядов для исследов

Последнее сообщение Anonymous « 26 сен 2024, 17:36
Добавлено в форуме Python

Anonymous » 26 сен 2024, 17:36 » в форуме Python

У меня есть следующий кадр данных pandas
import pandas as pd
pd.DataFrame({
'region': ,
'week': ,
'rain': ,
'clouds':
})

region week rain clouds
0 1 1 1 1
1 1 2 1 1
2 1 3 0 0
3 1 4 1 0
4 2 1 1 0
5 2 2 1 0
6 2 3 1 1
7 2 4 1 0
8 3 1 1 1
9 3 2 0 0...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
26 сен 2024, 17:36
Прогнозирование нескольких многомерных временных рядов с помощью LSTM вместе с некоторыми категориальными функциями.

Последнее сообщение Anonymous « 08 окт 2024, 17:29
Добавлено в форуме Python

Anonymous » 08 окт 2024, 17:29 » в форуме Python

В настоящее время я работаю над данными временного ряда, которые выглядят следующим образом
нажмите, чтобы просмотреть данные
Данные состоят из 5 компаний, 15 продуктов (в каждой компании 3-5 продуктов) и 6 разных регионов
Цель Построить единый...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
08 окт 2024, 17:29
Прогнозирование нескольких многомерных временных рядов с помощью LSTM вместе с некоторыми категориальными функциями.

Последнее сообщение Anonymous « 08 окт 2024, 18:28
Добавлено в форуме Python

Anonymous » 08 окт 2024, 18:28 » в форуме Python

В настоящее время я работаю над данными временного ряда, которые выглядят следующим образом
нажмите, чтобы просмотреть данные
Данные состоят из 5 компаний, 15 продуктов (в каждой компании 3-5 продуктов) и 6 разных регионов
Цель Построить единый...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
08 окт 2024, 18:28
Прогнозирование временных рядов с помощью scikit Learn

Последнее сообщение Anonymous « 24 окт 2024, 23:08
Добавлено в форуме Python

Anonymous » 24 окт 2024, 23:08 » в форуме Python

Я пытаюсь настроить код Python для прогнозирования временных рядов, используя модель SVM scikit-learn.
Мои данные содержат значения X с 30-минутным интервалом для последние 24 часа, и мне нужно предсказать y для следующей отметки времени. Вот что я...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
24 окт 2024, 23:08
Прогнозирование многомерных временных рядов (в главе 15 книги «Практическое машинное обучение...») Ошибка

Последнее сообщение Anonymous « 19 сен 2024, 22:39
Добавлено в форуме Python

Anonymous » 19 сен 2024, 22:39 » в форуме Python

Я работаю с блокнотом Jupyter, описанным в главе 15 книги Практическое машинное обучение с помощью Scikit-Learn, Keras & TensorFlow Орельена Жерона (третье издание). Я обнаружил ошибку в ячейке 43 записной книжки. Это в параграфе Многомерные...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 22:39

Вернуться в «Python»

Programmiererforum