Как изменить начальную точку появления тележки при сбросе окружения? Мне нужно использовать собственное вознаграждение при тестировании. Вознаграждение типа:
def new_reward(state, x0):
s = state[0]
theta = state[2]
max_reward = 500
min_reward = 0
r_center = np.exp(-((s - x0) ** 2) / 0.5)
r_angle = np.exp(-(theta ** 2) / 0.1)
reward = r_center+0.5*r_angle
return reward
Однако я в этом не уверен. Есть совет?
Кроме того, x0 — это начальная точка появления.
Я попробовал передать: --central_point 1.0, так как по умолчанию это 0.0:
parser.add_argument("--central_point", type=float, default=None,
help="Point x0 to fluctuate around")
Я также попробовал изменить его вручную:
def train(agent, env, train_episodes, early_stop=True, render=False,
silent=False, train_run_id=0, x0=0.0, random_policy=False):
Или изменить его после сброса:
observation = env.reset()
x0 = 2
Подробнее здесь: https://stackoverflow.com/questions/792 ... pawn-point
Точка появления спортзала Cartpole ⇐ Python
Программы на Python
1732897867
Anonymous
Как изменить начальную точку появления тележки при сбросе окружения? Мне нужно использовать собственное вознаграждение при тестировании. Вознаграждение типа:
def new_reward(state, x0):
s = state[0]
theta = state[2]
max_reward = 500
min_reward = 0
r_center = np.exp(-((s - x0) ** 2) / 0.5)
r_angle = np.exp(-(theta ** 2) / 0.1)
reward = r_center+0.5*r_angle
return reward
Однако я в этом не уверен. Есть совет?
Кроме того, x0 — это начальная точка появления.
Я попробовал передать: --central_point 1.0, так как по умолчанию это 0.0:
parser.add_argument("--central_point", type=float, default=None,
help="Point x0 to fluctuate around")
Я также попробовал изменить его вручную:
def train(agent, env, train_episodes, early_stop=True, render=False,
silent=False, train_run_id=0, x0=0.0, random_policy=False):
Или изменить его после сброса:
observation = env.reset()
x0 = 2
Подробнее здесь: [url]https://stackoverflow.com/questions/79236139/cartpole-gym-spawn-point[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия