Как предотвратить перегрузку ядра процессора большой моделью случайного леса sklearn? - Цифровое Кемерово

Как предотвратить перегрузку ядра процессора большой моделью случайного леса sklearn? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как предотвратить перегрузку ядра процессора большой моделью случайного леса sklearn?

Цитата

Сообщение Anonymous » 01 окт 2024, 18:49

Я обучил модель случайного леса с помощью sklearn, используя RandomizedSearchCV.
Я сохранил модель как файл joblib и теперь использую ее для ежедневного составления прогнозов на сервере в контейнере Docker.
По сути, это следующий процесс:
watcher.py:

Код: Выделить всё

def watch():

def run_script():
scripts = ["forecaster.py"]
for script in scripts:
subprocess.run(['python', script], check=True)
time.sleep(63)

while True:
now = datetime.datetime.now(pytz.utc).astimezone(berlin_tz)
if now.hour == 23 and now.minute == 0:
logging.info(f"Running scripts at {now}.")
run_script()
time.sleep(3)

if __name__ == '__main__':
logging.info("Watcher gestartet")
watch()

forecaster.py:

Код: Выделить всё

data = get_data_from_API(...)
features = ["list", "of", "variables", "contained", "in", "data"]

rf = load(model_path.joblib)
rf_pred = rf.predict(data[features])

table = pd.DataFrame({
'UTC': data['UTC'],
'Forecast': rf_pred
})
table.to_csv('somepath.csv')

Однако недавно я обучил несколько более качественных моделей, которые имеют больший размер (>100 000 КБ, так что я думаю, что они не такие большие), и теперь мой скрипт продолжает убиваться. (), и я вижу на рабочем столе Docker, что загрузка ЦП достигает 100% (ядро сервера имеет меньшие возможности, чем мой ноутбук, на котором я обучал модель).
Я пробовал модели разного размера. Меньшие модели работают без проблем, но большие модели дают сбой.
На данный момент я придерживаюсь меньших моделей, которые менее точны, и это работает, но я ищу решение, которое работает для любой модели, которую я хотел бы использовать. .
Я подумал, что, вероятно, параллельная обработка могла бы быть решением, но я нахожу только учебные пособия, которые либо работают только с другими библиотеками, такими как PyTorch, либо посвящены распараллеливанию при обучении модели, а не при ее применении. .
Будем рады любым предложениям!

Подробнее здесь: https://stackoverflow.com/questions/790 ... e-cpu-core

Реклама

1727797784

Anonymous

Я обучил модель случайного леса с помощью sklearn, используя RandomizedSearchCV.
Я сохранил модель как файл joblib и теперь использую ее для ежедневного составления прогнозов на сервере в контейнере Docker.
По сути, это следующий процесс:
watcher.py:
[code]def watch():

def run_script():
scripts = ["forecaster.py"]
for script in scripts:
subprocess.run(['python', script], check=True)
time.sleep(63)

while True:
now = datetime.datetime.now(pytz.utc).astimezone(berlin_tz)
if now.hour == 23 and now.minute == 0:
logging.info(f"Running scripts at {now}.")
run_script()
time.sleep(3)

if __name__ == '__main__':
logging.info("Watcher gestartet")
watch()
[/code]
forecaster.py:
[code]data = get_data_from_API(...)
features = ["list", "of", "variables", "contained", "in", "data"]

rf = load(model_path.joblib)
rf_pred = rf.predict(data[features])

table = pd.DataFrame({
'UTC': data['UTC'],
'Forecast': rf_pred
})
table.to_csv('somepath.csv')
[/code]
Однако недавно я обучил несколько более качественных моделей, которые имеют больший размер (>100 000 КБ, так что я думаю, что они не такие большие), и теперь мой скрипт продолжает убиваться. (), и я вижу на рабочем столе Docker, что загрузка ЦП достигает 100% (ядро сервера имеет меньшие возможности, чем мой ноутбук, на котором я обучал модель).
Я пробовал модели разного размера. Меньшие модели работают без проблем, но большие модели дают сбой.
На данный момент я придерживаюсь меньших моделей, которые менее точны, и это работает, но я ищу решение, которое работает для любой модели, которую я хотел бы использовать. .
Я подумал, что, вероятно, параллельная обработка могла бы быть решением, но я нахожу только учебные пособия, которые либо работают только с другими библиотеками, такими как PyTorch, либо посвящены распараллеливанию при обучении модели, а не при ее применении. .
Будем рады любым предложениям! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79043871/how-to-prevent-big-sklearn-random-forest-model-from-overloading-the-cpu-core[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Различные результаты (с семенами) для случайного леса Sklearn

Последнее сообщение Гость « 04 фев 2025, 13:51
Добавлено в форуме Python

Гость » 04 фев 2025, 13:51 » в форуме Python

Я использую Sklearn, чтобы запустить случайный лес. Я устанавливаю семя для случайного леса, а также разделяю данные для перекрестной проверки. Когда я перезапустил код подряд, он дает мне тот же результат. Тем не менее, перезагружая один и тот же...

0 Ответы

10 Просмотры

Последнее сообщение Гость
04 фев 2025, 13:51
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 01:49
Добавлено в форуме Python

Anonymous » 02 дек 2024, 01:49 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

56 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 01:49
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 13:06
Добавлено в форуме Python

Anonymous » 02 дек 2024, 13:06 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

57 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 13:06
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 07 дек 2024, 02:51
Добавлено в форуме Python

Anonymous » 07 дек 2024, 02:51 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

48 Просмотры

Последнее сообщение Anonymous
07 дек 2024, 02:51
Обученная модель случайного леса из Python в Matlab

Последнее сообщение Гость « 14 мар 2024, 17:38
Добавлено в форуме Python

Гость » 14 мар 2024, 17:38 » в форуме Python

У меня есть модель, использующая случайный лес, разработанная на Python. Теперь я хочу использовать эту обученную сеть в Matlab. Как перенести обученную сеть с Python на Matlab. Может кто-нибудь, пожалуйста, дайте мне знать, как это сделать?
Я...

0 Ответы

33 Просмотры

Последнее сообщение Гость
14 мар 2024, 17:38

Вернуться в «Python»

Programmiererforum