Есть ли способ перебрать каждое состояние, заставить среду перейти в это состояние, а затем сделать шаг, а затем использовать возвращенный словарь «info», чтобы увидеть, каковы все возможные состояния-преемники?
Или еще более простой способ восстановить все возможные состояния-преемники для каждого состояния, возможно, где-то спрятанные?
Я видел в Интернете это что-то под названием MuJoKo или что-то в этом роде есть функция set_state, но я я не хочу создавать новую среду, я просто хочу установить состояние тех, которые уже предоставлены тренажерным залом openAi.
Контекст: попытка реализовать итерацию значений топологического порядка , для чего требуется создать график, в котором каждое состояние имеет границу с любым состоянием, в которое его может перевести любое действие.
Я понимаю, что в некоторых играх это просто не предусмотрено. , а для тех, где он есть, есть ли способ?
(Кроме грубого метода запуска игры и выполнения каждого шага, который я еще не сделал в каком бы состоянии я ни оказался, пока я не достиг всех состояний и не увидел все, что в зависимости от игра может длиться вечно)
Я впервые использую тренажерный зал OpenAi, поэтому, пожалуйста, объясните как можно подробнее. Например, я понятия не имею, что такое Wrappers.
Спасибо!
Подробнее здесь: https://stackoverflow.com/questions/536 ... trictly-fo
Как составить список возможных состояний-преемников для каждого состояния в тренажерном зале OpenAI? (строго для обычных ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Модуль «numpy» не имеет атрибута «bool8». Проблема с тележкой в тренажерном зале openai.
Anonymous » » в форуме Python - 0 Ответы
- 19 Просмотры
-
Последнее сообщение Anonymous
-