IndexError в SBX (Stable Baselines 3) с Flax: «индекс кортежа вне диапазона» во время инициализации сети субъектов

IndexError в SBX (Stable Baselines 3) с Flax: «индекс кортежа вне диапазона» во время инициализации сети субъектов ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

IndexError в SBX (Stable Baselines 3) с Flax: «индекс кортежа вне диапазона» во время инициализации сети субъектов

Цитата

Сообщение Anonymous » 10 янв 2025, 06:20

Ранее я реализовал SAC со стабильными базовыми линиями3 в специальной среде Gymnasium, и это сработало. Теперь я пытаюсь использовать JAX стабильного базового уровня3 (SBX) в той же среде, но сталкиваюсь с этой ошибкой во время инициализации модели SAC:

Код: Выделить всё

"/workspaces/ros2_ws_humble/src/rl_node/training_loops_method1/run_method1.py", line 158, in run_test
model = SAC(
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 112, in __init__
self._setup_model()
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 127, in _setup_model
self.key = self.policy.build(self.key, self.lr_schedule, self.qf_learning_rate)
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 120, in build#
params=self.actor.init(actor_key, obs),
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 35, in __call__
x = nn.Dense(n_units)(x)
File "/usr/local/lib/python3.10/dist-packages/flax/linen/linear.py", line 237, in __call__
(jnp.shape(inputs)[-1], self.features),
IndexError: tuple index out of range

Здесь я инициализирую модель SAC:

Код: Выделить всё

def run_test(config_, rl_node, run_count):
np.seterr(all='raise')
th.autograd.set_detect_anomaly(True)
env = None
mode = None
env = make_env(config_, rl_node)
env = RecordEpisodeStatistics(env, buffer_length=100)
env = DummyVecEnv([lambda: env])
model_name = "Agent_Long_absolut_05"
policy_kwargs = {"activation_fn": th.nn.Mish,"net_arch": {"pi":[32,32],"qf": [64, 64, 64]}}
model = SAC("MultiInputPolicy", env, learning_rate=0.01, gamma=0.8, batch_size=128, verbose=1, policy_kwargs=policy_kwargs,tensorboard_log=f"{parent_dir_path}/logs",device="cuda")

Ниже показано пространство наблюдения:

Код: Выделить всё

 obs_space = {
'obs_long_acc': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_long_jerk': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_relative_speed': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_relative_distance': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_time_elapsed' : gym.spaces.Box(low=0, high=100000, shape=(1,), dtype=np.float32),
'obs_parameters_valid' : gym.spaces.Box(low=0, high=1, shape=(1,), dtype=np.float32),
'obs_first_loop_err' : gym.spaces.Box(low=0, high=10, shape=(1,), dtype=np.float32),
'obs_second_loop_err': gym.spaces.Box(low=0, high=10, shape=(1,), dtype=np.float32),
'obs_parameter_score_1': gym.spaces.Box(low=-100, high=0, shape=(24,), dtype=np.float32),
'obs_parameter_score_2': gym.spaces.Box(low=-100, high=0, shape=(25,), dtype=np.float32),
'obs_crash': gym.spaces.Box(low=0, high=1, shape=(1,), dtype=np.float32),
}

self.observation_space = gym.spaces.Dict(obs_space)

Что может быть причиной ошибки IndexError в этом случае? Существует ли несоответствие между пространством наблюдения и архитектурой политики в SBX? Я некоторое время застрял в этой проблеме и был бы очень признателен за любые советы по ее решению. Спасибо.
Я попробовал использовать операцию выравнивания, чтобы обеспечить правильное выравнивание пространства наблюдения, но ошибка по-прежнему сохраняется во время инициализации.

Подробнее здесь: https://stackoverflow.com/questions/793 ... -range-dur

1736479206

Anonymous

Ранее я реализовал SAC со стабильными базовыми линиями3 в специальной среде Gymnasium, и это сработало. Теперь я пытаюсь использовать JAX стабильного базового уровня3 (SBX) в той же среде, но сталкиваюсь с этой ошибкой во время инициализации модели SAC:
[code]"/workspaces/ros2_ws_humble/src/rl_node/training_loops_method1/run_method1.py", line 158, in run_test
model = SAC(
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 112, in __init__
self._setup_model()
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/sac.py", line 127, in _setup_model
self.key = self.policy.build(self.key, self.lr_schedule, self.qf_learning_rate)
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 120, in build#
params=self.actor.init(actor_key, obs),
File "/usr/local/lib/python3.10/dist-packages/sbx/sac/policies.py", line 35, in __call__
x = nn.Dense(n_units)(x)
File "/usr/local/lib/python3.10/dist-packages/flax/linen/linear.py", line 237, in __call__
(jnp.shape(inputs)[-1], self.features),
IndexError: tuple index out of range
[/code]
Здесь я инициализирую модель SAC:
[code]def run_test(config_, rl_node, run_count):
np.seterr(all='raise')
th.autograd.set_detect_anomaly(True)
env = None
mode = None
env = make_env(config_, rl_node)
env = RecordEpisodeStatistics(env, buffer_length=100)
env = DummyVecEnv([lambda: env])
model_name = "Agent_Long_absolut_05"
policy_kwargs = {"activation_fn": th.nn.Mish,"net_arch": {"pi":[32,32],"qf": [64, 64, 64]}}
model = SAC("MultiInputPolicy", env, learning_rate=0.01, gamma=0.8, batch_size=128, verbose=1, policy_kwargs=policy_kwargs,tensorboard_log=f"{parent_dir_path}/logs",device="cuda")

[/code]
Ниже показано пространство наблюдения:
[code] obs_space = {
'obs_long_acc': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_long_jerk': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_relative_speed': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_relative_distance': gym.spaces.Box(low=-1000, high=1000, shape=(1,), dtype=np.float32),
'obs_time_elapsed' : gym.spaces.Box(low=0, high=100000, shape=(1,), dtype=np.float32),
'obs_parameters_valid' : gym.spaces.Box(low=0, high=1, shape=(1,), dtype=np.float32),
'obs_first_loop_err' : gym.spaces.Box(low=0, high=10, shape=(1,), dtype=np.float32),
'obs_second_loop_err': gym.spaces.Box(low=0, high=10, shape=(1,), dtype=np.float32),
'obs_parameter_score_1': gym.spaces.Box(low=-100, high=0, shape=(24,), dtype=np.float32),
'obs_parameter_score_2': gym.spaces.Box(low=-100, high=0, shape=(25,), dtype=np.float32),
'obs_crash': gym.spaces.Box(low=0, high=1, shape=(1,), dtype=np.float32),
}

self.observation_space = gym.spaces.Dict(obs_space)
[/code]
Что может быть причиной ошибки IndexError в этом случае? Существует ли несоответствие между пространством наблюдения и архитектурой политики в SBX? Я некоторое время застрял в этой проблеме и был бы очень признателен за любые советы по ее решению. Спасибо.
Я попробовал использовать операцию выравнивания, чтобы обеспечить правильное выравнивание пространства наблюдения, но ошибка по-прежнему сохраняется во время инициализации. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79344525/indexerror-in-sbx-stable-baselines-3-with-flax-tuple-index-out-of-range-dur[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему использование графического процессора в Stable Baselines 3 медленнее, чем использование процессора?

Последнее сообщение Anonymous « 18 дек 2024, 21:46
Добавлено в форуме Python

Anonymous » 18 дек 2024, 21:46 » в форуме Python

При обучении среды «CartPole» с помощью Stable Baselines 3 с использованием PPO я обнаружил, что обучение модели с использованием графического процессора cuda происходит почти в два раза медленнее, чем обучение модели только с процессором (как в...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
18 дек 2024, 21:46
PyInstaller в macOS: IndexError «индекс кортежа вне диапазона» при включении папки .app в данные

Последнее сообщение Anonymous « 25 окт 2024, 14:53
Добавлено в форуме Python

Anonymous » 25 окт 2024, 14:53 » в форуме Python

У меня возникла проблема с PyInstaller при сборке приложения Python на macOS . Я постоянно получаю следующую ошибку:
IndexError: tuple index out of range
...
File .../PyInstaller/utils/osx.py , line 672, in collect_files_from_framework_bundles...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
25 окт 2024, 14:53
Как устранить IndexError: индекс кортежа выходит за пределы диапазона для моего кода Python

Последнее сообщение Anonymous « 26 дек 2024, 07:01
Добавлено в форуме Python

Anonymous » 26 дек 2024, 07:01 » в форуме Python

Я пытался сделать фильтр шума, интегрированный с искусственным интеллектом. Но при компиляции следующего кода я столкнулся с ошибкой ниже. Как я могу решить эту проблему?
import librosa
import librosa.display
import numpy as np
import...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
26 дек 2024, 07:01
Исключение «Индекс Unity3D вне диапазона»: индекс массива выходит за пределы диапазона (попытка изменить спрайт при нажа

Последнее сообщение Anonymous « 13 ноя 2024, 19:02
Добавлено в форуме C#

Anonymous » 13 ноя 2024, 19:02 » в форуме C#

Доброе утро, разработчики. Я знаю, что этот вопрос задавался раньше, но я не нашел решения своей проблемы в этих ответах. Сначала я хотел бы сказать вам, что я всего лишь новичок в Unity :p, ну, вот моя проблема: я создаю игру с разбиванием...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
13 ноя 2024, 19:02
IndexError: индекс списка выходит за пределы диапазона в FAISS.from_documents

Последнее сообщение Anonymous « 06 мар 2024, 09:52
Добавлено в форуме Python

Anonymous » 06 мар 2024, 09:52 » в форуме Python

I'm encountering an error when using LangChain's FAISS module to build a vector index from a list of documents. Specifically, I'm getting an IndexError: list index out of range on the line where I call FAISS.from_documents(docs, embeddings).

My...

0 Ответы

72 Просмотры

Последнее сообщение Anonymous
06 мар 2024, 09:52

Вернуться в «Python»