Ранее я реализовал SAC со стабильными базовыми линиями3 в специальной среде Gymnasium, и это сработало. Теперь я пытаюсь использовать JAX стабильного базового уровня3 (SBX) в той же среде, но сталкиваюсь с этой ошибкой во время инициализации модели SAC:
"/workspaces/ros2_ws_humble/src/rl_node/training_loops_method1/run_method1.py", line 158, in run_test
model = SAC(
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 112, in __init__
self._setup_model()
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 127, in _setup_model
self.key = self.policy.build(self.key, self.lr_schedule, self.qf_learning_rate)
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 120, in build#
params=self.actor.init(actor_key, obs),
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 35, in __call__
x = nn.Dense(n_units)(x)
File "/usr/local/lib/python3.10/dist-packages/flax/linen/linear.py", line 237, in __call__
(jnp.shape(inputs)[-1], self.features),
IndexError: tuple index out of range
Что может быть причиной ошибки IndexError в этом случае? Существует ли несоответствие между пространством наблюдения и архитектурой политики в SBX? Я некоторое время застрял в этой проблеме и был бы очень признателен за любые советы по ее решению. Спасибо.
Я попробовал использовать операцию выравнивания, чтобы обеспечить правильное выравнивание пространства наблюдения, но ошибка по-прежнему сохраняется во время инициализации.
Ранее я реализовал SAC со стабильными базовыми линиями3 в специальной среде Gymnasium, и это сработало. Теперь я пытаюсь использовать JAX стабильного базового уровня3 (SBX) в той же среде, но сталкиваюсь с этой ошибкой во время инициализации модели SAC: [code]"/workspaces/ros2_ws_humble/src/rl_node/training_loops_method1/run_method1.py", line 158, in run_test model = SAC( File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 112, in __init__ self._setup_model() File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 127, in _setup_model self.key = self.policy.build(self.key, self.lr_schedule, self.qf_learning_rate) File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 120, in build# params=self.actor.init(actor_key, obs), File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 35, in __call__ x = nn.Dense(n_units)(x) File "/usr/local/lib/python3.10/dist-packages/flax/linen/linear.py", line 237, in __call__ (jnp.shape(inputs)[-1], self.features), IndexError: tuple index out of range [/code] Здесь я инициализирую модель SAC: [code]def run_test(config_, rl_node, run_count): np.seterr(all='raise') th.autograd.set_detect_anomaly(True) env = None mode = None env = make_env(config_, rl_node) env = RecordEpisodeStatistics(env, buffer_length=100) env = DummyVecEnv([lambda: env]) model_name = "Agent_Long_absolut_05" policy_kwargs = {"activation_fn": th.nn.Mish,"net_arch": {"pi":[32,32],"qf": [64, 64, 64]}} model = SAC("MultiInputPolicy", env, learning_rate=0.01, gamma=0.8, batch_size=128, verbose=1, policy_kwargs=policy_kwargs,tensorboard_log=f"{parent_dir_path}/logs",device="cuda")
self.observation_space = gym.spaces.Dict(obs_space) [/code] Что может быть причиной ошибки IndexError в этом случае? Существует ли несоответствие между пространством наблюдения и архитектурой политики в SBX? Я некоторое время застрял в этой проблеме и был бы очень признателен за любые советы по ее решению. Спасибо. Я попробовал использовать операцию выравнивания, чтобы обеспечить правильное выравнивание пространства наблюдения, но ошибка по-прежнему сохраняется во время инициализации.
При обучении среды «CartPole» с помощью Stable Baselines 3 с использованием PPO я обнаружил, что обучение модели с использованием графического процессора cuda происходит почти в два раза медленнее, чем обучение модели только с процессором (как в...
У меня возникла проблема с PyInstaller при сборке приложения Python на macOS . Я постоянно получаю следующую ошибку:
IndexError: tuple index out of range
...
File .../PyInstaller/utils/osx.py , line 672, in collect_files_from_framework_bundles...
Я пытался сделать фильтр шума, интегрированный с искусственным интеллектом. Но при компиляции следующего кода я столкнулся с ошибкой ниже. Как я могу решить эту проблему?
import librosa
import librosa.display
import numpy as np
import...
Доброе утро, разработчики. Я знаю, что этот вопрос задавался раньше, но я не нашел решения своей проблемы в этих ответах. Сначала я хотел бы сказать вам, что я всего лишь новичок в Unity :p, ну, вот моя проблема: я создаю игру с разбиванием...
I'm encountering an error when using LangChain's FAISS module to build a vector index from a list of documents. Specifically, I'm getting an IndexError: list index out of range on the line where I call FAISS.from_documents(docs, embeddings).