Недавно я пытался заставить агента понга с использованием обучения подкреплению, но я продолжаю получать ошибки, независимо от того, что я делаю. Реализация PPO, которую я использую, была первоначально разработана для Cartpole, и я изменил его для работы с Pong.
Недавно я пытался заставить агента понга с использованием обучения подкреплению, но я продолжаю получать ошибки, независимо от того, что я делаю. Реализация PPO, которую я использую, была первоначально разработана для Cartpole, и я изменил его для работы с Pong.[code]with torch.no_grad(): dummy = torch.zeros(1, 1, 96, 96) # batch=1, grayscale, 96x96 conv_out = self.shared_layers(dummy) flattened_size = conv_out.view(1, -1).shape[1]
# Inside ActorCriticNetwork.__init__() with torch.no_grad(): dummy = torch.zeros(1, 1, 96, 96) # simulate one preprocessed image conv_out = self.shared_layers(dummy) flattened_size = conv_out.view(1, -1).shape[1] < /code> и как он подключается к линейному слою: < /p> self.policy_layers = nn.Sequential( nn.Linear(flattened_size, 64), # ← uses flattened_size nn.ReLU(), nn.Linear(64, action_space_size) ) [/code] Полный код: https://github.com/twhighschooler/pong
Недавно я пытался заставить агента понга с использованием обучения подкреплению, но я продолжаю получать ошибки, независимо от того, что я делаю. Реализация PPO, которую я использую, была первоначально разработана для Cartpole, и я изменил его для...
Недавно я пытался заставить агента понга с использованием обучения подкреплению, но я продолжаю получать ошибки, независимо от того, что я делаю. Реализация PPO, которую я использую, была первоначально разработана для Cartpole, и я изменил его для...
I have just started doing Vision Transformer from scratch using pytorch. And the I got error like this when I run the training helper code. I know it is about the shape is not match, but I don't know which one I should do. The code is like this :...