Как обойти кунг -фу, бросающий нож, вражеский NES с Vision Transformer, ML

Как обойти кунг -фу, бросающий нож, вражеский NES с Vision Transformer, ML ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как обойти кунг -фу, бросающий нож, вражеский NES с Vision Transformer, ML

Цитата

Сообщение Anonymous » 03 апр 2025, 08:05

Я играю вокруг машинного обучения, обучая модель, которая надеется обойти 1 -й этап в Кунг -фу Нес. Репо < /p>
atm, я застрял на уровне 1 с вражеским ножом. (Закрытие боя в порядке до сих пор, расстояние - это проблема) Он предлагает сначала поездка на простую вознаграждение, прежде чем перейти к более сложным функциям вознаграждения. < /P>
def step(self, action):
obs, _, done, info = super().step(action)
ram = self.env.get_ram()

# Extract game state information
current_score = ram[self.ram_positions['score']] * 100
current_scroll = ram[self.ram_positions['scroll']]
current_hp = ram[self.ram_positions['hero_hp']]
current_pos_x = ram[self.ram_positions['hero_pos_x']]
current_stage = ram[self.ram_positions['stage']]

# Calculate deltas
score_delta = current_score - self.last_score
scroll_delta = current_scroll - self.last_scroll if current_scroll >= self.last_scroll else (current_scroll + 256 - self.last_scroll)
hp_loss = max(0, int(self.last_hp) - int(current_hp)) if self.last_hp is not None else 0
pos_delta = current_pos_x - self.last_pos_x

# Calculate reward components
reward = 0
reward += score_delta * 5 # Points gained
reward += scroll_delta * 10 # Progress through level
reward += pos_delta * 0.1 # Movement (small reward for moving)
reward -= hp_loss * 50 # Penalty for losing health

# Update tracking variables
self.last_score = current_score
self.last_scroll = current_scroll
self.last_hp = current_hp
self.last_pos_x = current_pos_x

# Calculate survival time
survival_time = time.time() - self.episode_start_time if self.episode_start_time else 0

# Add detailed info to the info dict
info['score'] = current_score
info['hp'] = current_hp
info['scroll'] = current_scroll
info['pos_x'] = current_pos_x
info['stage'] = current_stage
info['survival_time'] = survival_time
info['score_delta'] = score_delta
info['scroll_delta'] = scroll_delta
info['hp_loss'] = hp_loss
info['episode'] = {
'r': reward,
'l': 1, # Episode length (steps)
't': survival_time,
'score': current_score,
'scroll': current_scroll,
'hp': current_hp
}

return obs, reward, done, info
< /code>
Ранее я тренировался с более сложными функциями вознаграждения в течение всей ночи с 5_000_000, но все еще не в состоянии пройти. Я буду использовать награду, чтобы тренироваться больше, но я обеспокоен этой пустой тратой времени. Мне нужны некоторые предложения о том, как преодолеть это.

Подробнее здесь: https://stackoverflow.com/questions/795 ... sformer-ml

1743656753

Anonymous

 Я играю вокруг машинного обучения, обучая модель, которая надеется обойти 1 -й этап в Кунг -фу Нес. Репо < /p>
atm, я застрял на уровне 1 с вражеским ножом. (Закрытие боя в порядке до сих пор, расстояние - это проблема) Он предлагает сначала поездка на простую вознаграждение, прежде чем перейти к более сложным функциям вознаграждения. < /P>
def step(self, action):
obs, _, done, info = super().step(action)
ram = self.env.get_ram()

# Extract game state information
current_score = ram[self.ram_positions['score']] * 100
current_scroll = ram[self.ram_positions['scroll']]
current_hp = ram[self.ram_positions['hero_hp']]
current_pos_x = ram[self.ram_positions['hero_pos_x']]
current_stage = ram[self.ram_positions['stage']]

# Calculate deltas
score_delta = current_score - self.last_score
scroll_delta = current_scroll - self.last_scroll if current_scroll >= self.last_scroll else (current_scroll + 256 - self.last_scroll)
hp_loss = max(0, int(self.last_hp) - int(current_hp)) if self.last_hp is not None else 0
pos_delta = current_pos_x - self.last_pos_x

# Calculate reward components
reward = 0
reward += score_delta * 5          # Points gained
reward += scroll_delta * 10         # Progress through level
reward += pos_delta * 0.1           # Movement (small reward for moving)
reward -= hp_loss * 50              # Penalty for losing health

# Update tracking variables
self.last_score = current_score
self.last_scroll = current_scroll
self.last_hp = current_hp
self.last_pos_x = current_pos_x

# Calculate survival time
survival_time = time.time() - self.episode_start_time if self.episode_start_time else 0

# Add detailed info to the info dict
info['score'] = current_score
info['hp'] = current_hp
info['scroll'] = current_scroll
info['pos_x'] = current_pos_x
info['stage'] = current_stage
info['survival_time'] = survival_time
info['score_delta'] = score_delta
info['scroll_delta'] = scroll_delta
info['hp_loss'] = hp_loss
info['episode'] = {
'r': reward,
'l': 1,  # Episode length (steps)
't': survival_time,
'score': current_score,
'scroll': current_scroll,
'hp': current_hp
}

return obs, reward, done, info
< /code>
Ранее я тренировался с более сложными функциями вознаграждения в течение всей ночи с 5_000_000, но все еще не в состоянии пройти. Я буду использовать награду, чтобы тренироваться больше, но я обеспокоен этой пустой тратой времени. Мне нужны некоторые предложения о том, как преодолеть это.  

Подробнее здесь: [url]https://stackoverflow.com/questions/79552023/how-to-bypass-kung-fu-throwing-knife-enemy-nes-with-vision-transformer-ml[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка: формы mat1 и mat2 не могут быть умножены (30x50176 и 768x768) в Vision Transformer crom Scratch Pytorch

Последнее сообщение Anonymous « 04 мар 2024, 11:47
Добавлено в форуме Python

Anonymous » 04 мар 2024, 11:47 » в форуме Python

I have just started doing Vision Transformer from scratch using pytorch. And the I got error like this when I run the training helper code. I know it is about the shape is not match, but I don't know which one I should do. The code is like this :...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
04 мар 2024, 11:47
Как построить карту внимания для модели Vision Transformer

Последнее сообщение Anonymous « 13 апр 2024, 14:40
Добавлено в форуме Python

Anonymous » 13 апр 2024, 14:40 » в форуме Python

Я реализую модель Vision Transformer в рамках школьного проекта, и мне нужно построить карту внимания, чтобы сравнить различия между моделью CNN и моделью ViT, но я не знаю, как это сделать.
Для справки: я использовал код в этом блокноте, за...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
13 апр 2024, 14:40
Изменение модели Vision Transformer (ViT) в timm для пользовательской головы в PyTorch

Последнее сообщение Anonymous « 10 окт 2024, 13:35
Добавлено в форуме Python

Anonymous » 10 окт 2024, 13:35 » в форуме Python

Я работаю с моделью Vision Transformer (ViT), используя PyTorch и библиотеку timm. Моя цель — изменить модель ViT, чтобы заменить заголовок классификации по умолчанию пользовательским заголовком, который принимает среднее значение всех токенов и...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
10 окт 2024, 13:35
Изменение модели Vision Transformer (ViT) в формате Timm для пользовательской головы в PyTorch

Последнее сообщение Anonymous « 13 окт 2024, 18:24
Добавлено в форуме Python

Anonymous » 13 окт 2024, 18:24 » в форуме Python

Я работаю с моделью Vision Transformer (ViT), используя PyTorch и библиотеку timm. Моя цель — изменить модель ViT, чтобы заменить заголовок классификации по умолчанию пользовательским заголовком, который принимает среднее значение всех токенов и...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
13 окт 2024, 18:24
Модель Vision Transformer плохо обобщает независимый набор данных проверки.

Последнее сообщение Anonymous « 20 окт 2024, 09:40
Добавлено в форуме Python

Anonymous » 20 окт 2024, 09:40 » в форуме Python

Я тренирую модель Wave Vision Transformer. Код Wave_ViT доступен по ссылке ниже.

Я не менял код файлов wave_ViT.py и torch_wavelets.py. Единственное изменение, которое я внес, касается способа предоставления данных для модели. Мой исходный набор...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
20 окт 2024, 09:40

Вернуться в «Python»