Проблемы с запуском кода RL с использованием TensorFlow 2.10.1 и Keras-RL 0.4.2 — символическая ошибка ввода/выводаPython

Программы на Python
Ответить
Anonymous
 Проблемы с запуском кода RL с использованием TensorFlow 2.10.1 и Keras-RL 0.4.2 — символическая ошибка ввода/вывода

Сообщение Anonymous »

В настоящее время я изучаю машинное обучение и перешел от базовых моделей и нейронных сетей к обучению с подкреплением (RL). После просмотра руководства Николаса Ренотта (ссылка здесь) я попытался следовать коду, но столкнулся с некоторыми проблемами, поскольку руководство, как мне кажется, немного устарело. В частности, некоторые части кода вызывают ошибки, которые я не могу устранить.
Прежде чем опубликовать это, я попытался решить проблему путем поиска ответов, включая ссылку на этот вопрос StackOverflow: символические входные данные Keras /outputs не реализует __len__, но мне так и не удалось решить проблему.
Я использую следующие версии библиотек:
  • TensorFlow: 2.10.1
    Keras-RL: 0.4.2
Вот код, с которым я работаю:
import numpy as np
import random
import pygame
import gym
from rl.memory import SequentialMemory
from rl.policy import BoltzmannQPolicy
from rl.agents.dqn import DQNAgent
from keras.layers import Dense, Flatten
import tensorflow as tf

env = gym.make("CartPole-v1", render_mode="rgb_array")
states = env.observation_space.shape[0]
actions = env.action_space.n

def build_model(states, actions):
model = tf.keras.Sequential()
model.add(Dense(24, activation='relu', input_shape=(states,)))
model.add(Dense(24, activation='relu'))
model.add(Dense(actions, activation='linear'))
model.build((None, states))
return model

def buildAgent(model, actions):
policy = BoltzmannQPolicy()
memory = SequentialMemory(limit=50000, window_length=1)
dqn = DQNAgent(model, memory=memory, policy=policy, nb_actions=actions, nb_steps_warmup=10,
target_model_update=1e-2)
return dqn

model = build_model(states, actions)

DQN = buildAgent(model, actions)

DQN.compile(tf.keras.optimizers.Adam(learning_rate=1e-3), metrics=['mae'])
DQN.fit(env, nb_steps=50000, visualize=False, verbose=1)
scores = DQN.test(env, nb_episodes=100, visualize=True)
print(np.mean(scores.history['episode_reward']))
model.save('model.h5')


Подробнее здесь: https://stackoverflow.com/questions/791 ... -2-symboli
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»