Точка появления спортзала CartpolePython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Точка появления спортзала Cartpole

Сообщение Anonymous »

как я могу изменить начальную точку появления тележки при сбросе окружения? Мне нужно использовать собственное вознаграждение при тестировании. Вознаграждение типа:
def new_reward(state, x0):
s = state[0]
theta = state[2]
max_reward = 500
min_reward = 0
r_center = np.exp(-((s - x0) ** 2) / 0.5)
r_angle = np.exp(-(theta ** 2) / 0.1)
reward = r_center+0.5*r_angle

return reward

однако я в этом не уверен. Есть совет?
Кроме того, x0 — это начальная точка появления.
Я попробовал передать: --central_point 1.0, так как по умолчанию это 0.0:
parser.add_argument("--central_point", type=float, default=None,
help="Point x0 to fluctuate around")

я также пробовал изменить его вручную:
def train(agent, env, train_episodes, early_stop=True, render=False,
silent=False, train_run_id=0, x0=0.0, random_policy=False):

или измените его после сброса:
observation = env.reset()
x0 = 2


Подробнее здесь: https://stackoverflow.com/questions/792 ... pawn-point
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Точка появления спортзала Cartpole
    Anonymous » » в форуме Python
    0 Ответы
    6 Просмотры
    Последнее сообщение Anonymous
  • Почему эта точка не точка = новая точка (x: 1, y: 1); работа?
    Anonymous » » в форуме JAVA
    0 Ответы
    64 Просмотры
    Последнее сообщение Anonymous
  • Почему эта точка не точка = новая точка (x: 1, y: 1); работа? [закрыто]
    Anonymous » » в форуме JAVA
    0 Ответы
    64 Просмотры
    Последнее сообщение Anonymous
  • График вознаграждений Cartpole для обучения DQN
    Anonymous » » в форуме Python
    0 Ответы
    12 Просмотры
    Последнее сообщение Anonymous
  • Реализация PyTorch PPO для Cartpole-v0 застревает в локальной оптиме
    Anonymous » » в форуме Python
    0 Ответы
    11 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»