В моих экспериментах я использую среду Openai's Cartpole-v1 . Мне нужно установить состояние, а затем выполнить действие в этом состоянии. Когда я выполняю конкретное действие, оно не ведет себя так, как ожидалось. Например, когда используется действие «иди справа», оно движется влево. < /P>
У меня есть состояние s =[ 0.048 0.151 -0.037 -0.265] и действие: Перейти справа , который 1 в соответствии с документом.
Когда я применил действие 1 к S, я получаю новое состояние [-0,016 0,206 -0,029 -0,326]
Это должно перемещать правую сторону.
здесь Является ли код, который я пробовал: < /p>
env.reset()
state=[ 0.048 0.151 -0.037 -0.265]
env.state = env.unwrapped.state = state
s, reward, done, _ = env.step(action)
print(state,s)
Подробнее здесь: https://stackoverflow.com/questions/774 ... ide-why-it
Когда действие должно двигаться прямо в тележке, оно движется в левую сторону. Почему это так? Как это может быть решено ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как поставить позиции совы-карусель на левую/правую сторону слайдера в версии Angular 8?
Anonymous » » в форуме CSS - 0 Ответы
- 4 Просмотры
-
Последнее сообщение Anonymous
-