Обучение экстрактора пользовательских функций в стабильных базовых условиях3. Начиная с предварительно обученных весов? - Цифровое Кемерово

Обучение экстрактора пользовательских функций в стабильных базовых условиях3. Начиная с предварительно обученных весов? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Обучение экстрактора пользовательских функций в стабильных базовых условиях3. Начиная с предварительно обученных весов?

Цитата

Сообщение Anonymous » 08 июл 2024, 01:11

Я использую следующий экстрактор пользовательских функций для своей модели StableBaselines3:

Код: Выделить всё

import torch.nn as nn
from stable_baselines3 import PPO

class Encoder(nn.Module):
def __init__(self, input_dim, embedding_dim, hidden_dim, output_dim=2):
super(Encoder, self).__init__()
self.encoder = nn.Sequential(
nn.Linear(input_dim, embedding_dim),
nn.ReLU()
)
self.regressor = nn.Sequential(
nn.Linear(embedding_dim, hidden_dim),
nn.ReLU(),
)

def forward(self, x):
x = self.encoder(x)
x = self.regressor(x)
return x

model = Encoder(input_dim, embedding_dim, hidden_dim)
model.load_state_dict(torch.load('trained_model.pth'))

class CustomFeatureExtractor(BaseFeaturesExtractor):
def __init__(self, observation_space, features_dim):
super(CustomFeatureExtractor, self).__init__(observation_space, features_dim)
self.model = model  # Use the pre-trained model as the feature extractor

self._features_dim = features_dim

def forward(self, observations):
features = self.model(observations)
return features

policy_kwargs = {
"features_extractor_class": CustomFeatureExtractor,
"features_extractor_kwargs": {"features_dim": 64}
}

model = PPO("MlpPolicy", env=envs, policy_kwargs=policy_kwargs)

# Freeze all layers
for param in model.parameters():
param.requires_grad = False

На данный момент модель хорошо обучена, без проблем и с хорошими результатами. Теперь я хочу не замораживать веса и попытаться обучить Feature Extractor, начиная с начального предварительно обученного веса. Как я могу сделать это с помощью такого специального экстрактора функций, определенного как класс внутри другого класса? Мой экстрактор функций отличается от описанного в документации, поэтому я не уверен, что он будет обучен. Или он начнет обучение, если я разморозлю слои?

Подробнее здесь: https://stackoverflow.com/questions/787 ... -pre-train

Реклама

1720390260

Anonymous

Я использую следующий экстрактор пользовательских функций для своей модели StableBaselines3:
[code]import torch.nn as nn
from stable_baselines3 import PPO

class Encoder(nn.Module):
def __init__(self, input_dim, embedding_dim, hidden_dim, output_dim=2):
super(Encoder, self).__init__()
self.encoder = nn.Sequential(
nn.Linear(input_dim, embedding_dim),
nn.ReLU()
)
self.regressor = nn.Sequential(
nn.Linear(embedding_dim, hidden_dim),
nn.ReLU(),
)

def forward(self, x):
x = self.encoder(x)
x = self.regressor(x)
return x

model = Encoder(input_dim, embedding_dim, hidden_dim)
model.load_state_dict(torch.load('trained_model.pth'))

class CustomFeatureExtractor(BaseFeaturesExtractor):
def __init__(self, observation_space, features_dim):
super(CustomFeatureExtractor, self).__init__(observation_space, features_dim)
self.model = model  # Use the pre-trained model as the feature extractor

self._features_dim = features_dim

def forward(self, observations):
features = self.model(observations)
return features

policy_kwargs = {
"features_extractor_class": CustomFeatureExtractor,
"features_extractor_kwargs": {"features_dim": 64}
}

model = PPO("MlpPolicy", env=envs, policy_kwargs=policy_kwargs)

# Freeze all layers
for param in model.parameters():
param.requires_grad = False
[/code]
На данный момент модель хорошо обучена, без проблем и с хорошими результатами. Теперь я хочу не замораживать веса и попытаться обучить Feature Extractor, начиная с начального предварительно обученного веса. Как я могу сделать это с помощью такого специального экстрактора функций, определенного как класс внутри другого класса? Мой экстрактор функций отличается от описанного в документации, поэтому я не уверен, что он будет обучен. Или он начнет обучение, если я разморозлю слои? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78718554/training-a-custom-feature-extractor-in-stable-baselines3-starting-from-pre-train[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Обучение экстрактора пользовательских функций в стабильных базовых условиях3. Начиная с предварительно обученных весов?

Последнее сообщение Anonymous « 17 июл 2024, 16:54
Добавлено в форуме Python

Anonymous » 17 июл 2024, 16:54 » в форуме Python

Я использую следующий экстрактор пользовательских функций для своей модели StableBaselines3:
import torch.nn as nn
from stable_baselines3 import PPO

class Encoder(nn.Module):
def __init__(self, input_dim, embedding_dim, hidden_dim, output_dim=2):...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
17 июл 2024, 16:54
Расширенный случайный поиск на основе стабильных базовых показателей останавливает обучение после 2464 миллионов шагов

Последнее сообщение Anonymous « 03 авг 2024, 18:25
Добавлено в форуме Python

Anonymous » 03 авг 2024, 18:25 » в форуме Python

ARS всегда останавливается после 2464 миллионов шагов, несмотря на экспоненциальный рост вознаграждения
if __name__ == __main__ :

env = CustomEnv()
#check_env(env)
# Simplified architecture
policy_kwargs = dict(
net_arch= ,...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
03 авг 2024, 18:25
Обучение агента ML с использованием стабильных базовых показателей3, Python и Unity. Продолжайте получать такую же оши

Последнее сообщение Anonymous « 05 фев 2025, 08:46
Добавлено в форуме Python

Anonymous » 05 фев 2025, 08:46 » в форуме Python

В настоящее время я тренируюсь агентом ML, чтобы играть в игру, которую я разрабатываю в Unity. В настоящее время у меня возникают проблемы с преобразованием обученных агентских файлов в формат ONNX, чтобы они могли быть интегрированы с Unity....

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
05 фев 2025, 08:46
Создание папки Tensorboard с помощью стабильных базовых показателей не работает

Последнее сообщение Anonymous « 14 янв 2025, 01:00
Добавлено в форуме Python

Anonymous » 14 янв 2025, 01:00 » в форуме Python

В настоящее время я обучаю агентов обучения с подкреплением в гимназии и на стабильных базовых уровнях3. Для отслеживания прогресса обучения я использую тензорную доску, которая работала до сих пор (я скопировал и отредактировал свой рабочий...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
14 янв 2025, 01:00
Разработка системы распознавания изображений Deep Learning с использованием предварительно обученных моделей

Последнее сообщение Anonymous « 27 окт 2024, 01:11
Добавлено в форуме Python

Anonymous » 27 окт 2024, 01:11 » в форуме Python

Я хочу использовать предварительно обученные модели, такие как Xception, VGG16, ResNet50 и т. д., для своего проекта по распознаванию изображений глубокого обучения, чтобы быстро обучить модель на обучающем наборе с высокой точностью. У меня...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
27 окт 2024, 01:11

Вернуться в «Python»

Programmiererforum