Почему обучение многочисленных моделей глубокого обучения (через несколько терминалов) быстрее, чем обучение одной модел

Почему обучение многочисленных моделей глубокого обучения (через несколько терминалов) быстрее, чем обучение одной модел ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Почему обучение многочисленных моделей глубокого обучения (через несколько терминалов) быстрее, чем обучение одной модел

Цитата

Сообщение Anonymous » 31 май 2025, 23:47

Я обучаю модели глубокого обучения, используя Tensorflow (с поддержкой GPU) на моей локальной машине. Я заметил удивительное поведение: < /p>

Когда я тренирую только одну модель (в одном терминале), она работает медленнее. Один. SEED.gpus = tf.config.list_physical_devices('GPU')
if gpus:
for gpu in gpus:
tf.config.experimental.set_memory_growth(gpu, True)

grid = GridSearchCV(estimator=model, param_grid=param_grid, n_jobs=1, cv=3)
start_time = time.time()
grid_result = grid.fit(X, Y)
end_time = time.time()
< /code>
Обновление: я заметил, что при обучении одной модели Nvidia-SMI сообщила о состоянии производительности графического процессора как P8, что указывает на режим низкого мощного или холостого хода. Однако, когда я запустил несколько учебных процессов в отдельных терминалах, состояние производительности увеличилось до P4 или даже P3. Я считаю, что это объясняет поведение, которое я наблюдал.

Подробнее здесь: https://stackoverflow.com/questions/796 ... -faster-th

1748724434

Anonymous

 Я обучаю модели глубокого обучения, используя Tensorflow (с поддержкой GPU) на моей локальной машине. Я заметил удивительное поведение: < /p>

  Когда я тренирую только одну модель (в одном терминале), она работает медленнее. Один. SEED.gpus = tf.config.list_physical_devices('GPU')
if gpus:
for gpu in gpus:
tf.config.experimental.set_memory_growth(gpu, True)

grid = GridSearchCV(estimator=model, param_grid=param_grid, n_jobs=1, cv=3)
start_time = time.time()
grid_result = grid.fit(X, Y)
end_time = time.time()
< /code>
Обновление: я заметил, что при обучении одной модели Nvidia-SMI сообщила о состоянии производительности графического процессора как P8, что указывает на режим низкого мощного или холостого хода. Однако, когда я запустил несколько учебных процессов в отдельных терминалах, состояние производительности увеличилось до P4 или даже P3. Я считаю, что это объясняет поведение, которое я наблюдал.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79646273/why-is-training-multiple-deep-learning-models-via-multiple-terminals-faster-th[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему обучение многочисленных моделей глубокого обучения (через несколько терминалов) быстрее, чем обучение одной модел

Последнее сообщение Anonymous « 31 май 2025, 05:34
Добавлено в форуме Python

Anonymous » 31 май 2025, 05:34 » в форуме Python

Я обучаю модели глубокого обучения, используя Tensorflow (с поддержкой GPU) на моей локальной машине. Я заметил удивительное поведение:

Когда я тренирую только одну модель (в одном терминале), она работает медленнее. Один. SEED.gpus =...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
31 май 2025, 05:34
Можно ли использовать библиотеку Keras для создания моделей глубокого обучения, или я должен написать все с нуля, исполь

Последнее сообщение Anonymous « 17 май 2025, 13:52
Добавлено в форуме Python

Anonymous » 17 май 2025, 13:52 » в форуме Python

Я студент, который сейчас изучаю глубокое обучение. У меня всегда были сомнения в том, как эффективно улучшить свои навыки кодирования, особенно когда речь идет о создании моделей. Библиотеки высокого уровня? Любой совет был бы оценен!

Подробнее...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
17 май 2025, 13:52
Проблема обучения модели глубокого обучения

Последнее сообщение Anonymous « 21 май 2024, 01:22
Добавлено в форуме Python

Anonymous » 21 май 2024, 01:22 » в форуме Python

Я столкнулся с проблемой во время построения модели глубокого обучения и процесса обучения, когда работал с Jupyter Notebook в коде VS.
Я пытался обучить модель глубокого обучения, которую я построил с помощью Tensorflow, используя метод model.fit,...

0 Ответы

58 Просмотры

Последнее сообщение Anonymous
21 май 2024, 01:22
Как сократить разрыв между результатами обучения и тестов для разных моделей машинного обучения?

Последнее сообщение Anonymous « 29 июн 2024, 20:20
Добавлено в форуме Python

Anonymous » 29 июн 2024, 20:20 » в форуме Python

Я использую несколько моделей машинного обучения для прогнозирования AQI. Данные представлены в ежедневном формате и содержат 1850 записей. Я получаю оценку R2 в поезде около 99 и оценку за тест около 91. Нормален ли этот разрыв? Если нет, как я...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
29 июн 2024, 20:20
Как сократить разрыв между результатами обучения и тестов для разных моделей машинного обучения?

Последнее сообщение Anonymous « 29 июн 2024, 21:13
Добавлено в форуме Python

Anonymous » 29 июн 2024, 21:13 » в форуме Python

Я использую несколько моделей машинного обучения для прогнозирования AQI. Данные представлены в ежедневном формате и содержат 1850 записей. Я получаю оценку R2 в поезде около 99 и оценку за тест около 91. Нормален ли этот разрыв? Если нет, как я...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
29 июн 2024, 21:13

Вернуться в «Python»