Стабильные базовые показатели 3, не генерирующие тензорные файлы для ppo, sac и td3Python

Программы на Python
Ответить
Anonymous
 Стабильные базовые показатели 3, не генерирующие тензорные файлы для ppo, sac и td3

Сообщение Anonymous »

Я сравниваю модели a2c, dqn и ppo. Мне нужны тензорные графики, чтобы показать их учителю. Тензорная доска собирает данные только для модели a2c, при использовании ее для ppo, sac или td3 она создает файл событий, но не добавляет в него никакой информации.
Код для ppop и a2c то же самое:

Код: Выделить всё

ppo:
import os
from stable_baselines3.common.env_util import make_vec_env
from stable_baselines3.common.logger import configure
from stable_baselines3.common.vec_env import SubprocVecEnv

log_path_ppo = "log/ppo_cartpole_tensorboard/"
#log_path_ppo = "log/ppo_lunar_tensorboard/"

model_ppo.set_logger(configure(log_path_ppo, ["tensorboard"]))
model_ppo.learn(total_timesteps=5000,log_interval=1000, progress_bar=True)

model_ppo.save("ppo_cartpole_model")
# model_ppo.save("ppo_lunar_model")

del model_ppo
del env

Код: Выделить всё

a2c:
import os
from stable_baselines3.common.env_util import make_vec_env
from stable_baselines3.common.logger import configure
from stable_baselines3.common.vec_env import SubprocVecEnv

# log_path_a2c = "log/a2c_cartpole_tensorboard/lunar-env/"
log_path_a2c = "log/a2c_cartpole_tensorboard/"

model_a2c.set_logger(configure(log_path_a2c, ["tensorboard"]))
model_a2c.learn(total_timesteps=5000,log_interval=1000, progress_bar=True)

model_a2c.save("a2c_cartpole_model")
#model_a2c.save("a2c_lunar_model")

del model_a2c
del env
И модели, и среды создаются в других фрагментах.
Для a2c это работает и создает все необходимые графики для тензорной доски, но для ppo это работает нет.
Я пробовал использовать другой синтаксис из документации, который снова работал только для a2c. ([https://stable-baselines3.readthedocs.i ... asic-usage]).
Также попробовал добавить запись в код ppop вместо регистратор, хотя он и работал, записывая информацию в код события, но тензорная доска могла загружать графики, логистика, скорее всего, была неправильной в этом коде.
Пытался установить стабильные базовые линии3 с помощью [ EXTRA] тег, но это тоже не сработало.

Подробнее здесь: https://stackoverflow.com/questions/793 ... ac-and-td3
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»