ИИ в Python - добавление большего количества временных точек делает мою модель «провалиться»

ИИ в Python - добавление большего количества временных точек делает мою модель «провалиться» ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

ИИ в Python - добавление большего количества временных точек делает мою модель «провалиться»

Цитата

Сообщение Anonymous » 14 фев 2025, 11:12

hi! Я только что сделал свою первую модель в стабильных Baselines3, используя Pygame в Python. Игра посвящена мячу, достигающему самой высокой платформы из трех, размещенных в небе. < /P>
Мне удалось заставить модель научиться туда добраться. Но затем, достигнув третьей платформы, она падает и остается на земле. Я хотел обучить новую модель, которая решила бы эту проблему, но, к моему удивлению, увеличивая Total_timesteps до 500_000, полностью не снят тест - мяч просто прыгает в одном месте, тогда как модель с гораздо меньшим количеством - 150_000 добралась до самой высокой платформы!
Почему это? Вот моя функция вызова < /p>
@edit
Я подумал, что иногда модель узнает, как туда добраться даже с меньшим количеством времени ~ = 15_000.
может быть это Из -за чистой удачи + энтропия?
И если да, то какие гиперпараметры/лучшая система вознаграждения я могу реализовать для мяча?
Это моя функция вознаграждения: < Br />

Код: Выделить всё

    reward = -1 # Default reward

# Reward for moving towards the goal platform
dist_reward = int((1/self.goal_distance) * 10000)
reward += dist_reward

# Reward for being airborne
if self.y_acc != 0 and self.ball.player_pos.y < GROUND_Y:
reward += 10

# Reward for moving right/left
if self.x_velocity != 0 :
reward += 1

if (collision_plat0 is not None and collision_plat0["top"]):
# Negative reward for hitting the floor
reward -= 50
if(collision_plat1 is not None and collision_plat1["top"]):
# Reward for reaching the first platform
reward += 2
elif(collision_plat2 is not None and collision_plat2["top"]):
# Reward for reaching the second platform
reward += 3
elif(collision_plat3 is not None and collision_plat3["top"]):
# Reward for reaching the third platform
reward += 30000000
< /code>
есть код моего движения, если он может прийти полезным: < /p>
if action is not None:
# Handle movement
if action == 0:  # Move left
self.ball.player_pos.x -= 5
self.x_velocity = -5
#reward = 0.001
elif action == 1:  # Move right
self.ball.player_pos.x += 5
self.x_velocity = 5
#reward = 0.001

collision_top = False
for i, platform in enumerate(self.platforms):
collision = check_collision_ball_rect(self.ball, platform)
if collision:
if collision["top"]:
collision_top = True
self.y_acc = 0
if action == 2:
self.y_acc = 20
else:
self.ball.player_pos.y = platform.top - self.ball.radius
if collision["bottom"]:
self.ball.player_pos.y = platform.bottom + self.ball.radius
if collision["left"] and action == 1:
self.ball.player_pos.x = platform.left - self.ball.radius
self.x_velocity = 0
if collision["right"] and action == 0:
self.ball.player_pos.x = platform.right + self.ball.radius
self.x_velocity = 0

if self.y_acc > 0 or not collision_top:
self.y_acc -= 1

# Apply gravity
self.ball.player_pos.y += GRAVITY - self.y_acc

Я в основном перемещаю шарик 5 px/кадр справа или влево + он может прыгать с ускорением с применением тяжести (я также проверяю столкновения с прямоугольниками).

Подробнее здесь: https://stackoverflow.com/questions/794 ... model-fail

1739520743

Anonymous

  
hi! Я только что сделал свою первую модель в стабильных Baselines3, используя Pygame в Python. Игра посвящена мячу, достигающему самой высокой платформы из трех, размещенных в небе. < /P>
Мне удалось заставить модель научиться туда добраться. Но затем, достигнув третьей платформы, она падает и остается на земле. Я хотел обучить новую модель, которая решила бы эту проблему, но, к моему удивлению, увеличивая Total_timesteps до 500_000, полностью не снят тест - мяч просто прыгает в одном месте, тогда как модель с гораздо меньшим количеством - 150_000 добралась до самой высокой платформы! 
Почему это?  Вот моя функция вызова < /p>
@edit
Я подумал, что иногда модель узнает, как туда добраться даже с меньшим количеством времени ~ = 15_000.
может быть это Из -за чистой удачи + энтропия?
И если да, то какие гиперпараметры/лучшая система вознаграждения я могу реализовать для мяча? 
Это моя функция вознаграждения:  < Br />[code]    reward = -1 # Default reward

# Reward for moving towards the goal platform
dist_reward = int((1/self.goal_distance) * 10000)
reward += dist_reward

# Reward for being airborne
if self.y_acc != 0 and self.ball.player_pos.y < GROUND_Y:
reward += 10

# Reward for moving right/left
if self.x_velocity != 0 :
reward += 1

if (collision_plat0 is not None and collision_plat0["top"]):
# Negative reward for hitting the floor
reward -= 50
if(collision_plat1 is not None and collision_plat1["top"]):
# Reward for reaching the first platform
reward += 2
elif(collision_plat2 is not None and collision_plat2["top"]):
# Reward for reaching the second platform
reward += 3
elif(collision_plat3 is not None and collision_plat3["top"]):
# Reward for reaching the third platform
reward += 30000000
< /code>
есть код моего движения, если он может прийти полезным: < /p>
if action is not None:
# Handle movement
if action == 0:  # Move left
self.ball.player_pos.x -= 5
self.x_velocity = -5
#reward = 0.001
elif action == 1:  # Move right
self.ball.player_pos.x += 5
self.x_velocity = 5
#reward = 0.001

collision_top = False
for i, platform in enumerate(self.platforms):
collision = check_collision_ball_rect(self.ball, platform)
if collision:
if collision["top"]:
collision_top = True
self.y_acc = 0
if action == 2:
self.y_acc = 20
else:
self.ball.player_pos.y = platform.top - self.ball.radius
if collision["bottom"]:
self.ball.player_pos.y = platform.bottom + self.ball.radius
if collision["left"] and action == 1:
self.ball.player_pos.x = platform.left - self.ball.radius
self.x_velocity = 0
if collision["right"] and action == 0:
self.ball.player_pos.x = platform.right + self.ball.radius
self.x_velocity = 0

if self.y_acc > 0 or not collision_top:
self.y_acc -= 1

# Apply gravity
self.ball.player_pos.y += GRAVITY - self.y_acc
[/code]
Я в основном перемещаю шарик 5 px/кадр справа или влево + он может прыгать с ускорением с применением тяжести (я также проверяю столкновения с прямоугольниками).  

Подробнее здесь: [url]https://stackoverflow.com/questions/79438720/ai-in-python-adding-more-timesteps-makes-my-model-fail[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему прогноз среднего значения не меняется после добавления большего количества точек данных в регрессор гауссовского

Последнее сообщение Anonymous « 16 окт 2024, 13:59
Добавлено в форуме Python

Anonymous » 16 окт 2024, 13:59 » в форуме Python

Я пытаюсь выполнить байесовскую оптимизацию в симуляторе робота, чтобы найти оптимальные значения Kd и Kp, соответствующие желаемой траектории (синусоидальное движение). Сначала я делаю несколько случайных движений руки, используя случайные значения...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
16 окт 2024, 13:59
Почему прогноз среднего значения не меняется после добавления большего количества точек данных в регрессор гауссовского

Последнее сообщение Anonymous « 16 окт 2024, 15:07
Добавлено в форуме Python

Anonymous » 16 окт 2024, 15:07 » в форуме Python

Я пытаюсь выполнить байесовскую оптимизацию в симуляторе робота, чтобы найти оптимальные значения Kd и Kp, соответствующие желаемой траектории (синусоидальное движение). Сначала я делаю несколько случайных движений руки, используя случайные значения...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
16 окт 2024, 15:07
Почему прогноз среднего значения не меняется после добавления большего количества точек данных в регрессор гауссовского

Последнее сообщение Anonymous « 17 окт 2024, 00:13
Добавлено в форуме Python

Anonymous » 17 окт 2024, 00:13 » в форуме Python

Я пытаюсь выполнить байесовскую оптимизацию в симуляторе робота, чтобы найти оптимальные значения Kd и Kp, соответствующие желаемой траектории (синусоидальное движение). Сначала я делаю несколько случайных движений руки, используя случайные значения...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 00:13
Добавление большего количества данных уменьшает графики фасетной сетки морского побережья?

Последнее сообщение Anonymous « 13 ноя 2024, 10:12
Добавлено в форуме Python

Anonymous » 13 ноя 2024, 10:12 » в форуме Python

Я провожу небольшое исследование для своей работы и добавил категориальный столбец со значениями True/False, поэтому размер DataFrame увеличился вдвое.
При этом размеры графики уменьшились, несмотря ни на что, кроме изменения количества строк.
Это...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
13 ноя 2024, 10:12
Odoo v15 qweb report date_format и конфигурация Добавление большего количества пробелов ( %m - %d - %y)

Последнее сообщение Anonymous « 24 июл 2025, 02:17
Добавлено в форуме Python

Anonymous » 24 июл 2025, 02:17 » в форуме Python

Я попробовал
context_timestamp(datetime.datetime.(page®. /> Но максимальное пространство составляет всего 1, оно не будет соответствовать в формате проверки банков, который требует 2 пространства между числами («дата») на учетной записи qweb report...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
24 июл 2025, 02:17

Вернуться в «Python»