Почему обучение DDPG различается со временем при оптимизации с минимальными затратами? - Цифровое Кемерово

Почему обучение DDPG различается со временем при оптимизации с минимальными затратами? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Почему обучение DDPG различается со временем при оптимизации с минимальными затратами?

Цитата

Сообщение Anonymous » 06 янв 2026, 06:34

Каковы распространенные причины, по которым эффективность обучения со временем снижается — например, при оптимизации с минимальными затратами, но затраты продолжают расти, а вознаграждение симметрично уменьшается во время обучения? Спасибо

Подробнее здесь: https://stackoverflow.com/questions/798 ... nimum-cost

1767670443

Anonymous

Каковы распространенные причины, по которым эффективность обучения со временем снижается — например, при оптимизации с минимальными затратами, но затраты продолжают расти, а вознаграждение симметрично уменьшается во время обучения? Спасибо 

Подробнее здесь: [url]https://stackoverflow.com/questions/79861263/why-does-ddpg-training-diverge-over-time-when-optimizing-for-minimum-cost[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»