Model.eval () возвращает неэтип -объект при использовании DeepSpeed

Model.eval () возвращает неэтип -объект при использовании DeepSpeed ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Model.eval () возвращает неэтип -объект при использовании DeepSpeed

Цитата

Сообщение Anonymous » 16 мар 2025, 00:29

Когда я хочу ускорить обучение модели с помощью DeepSpeed, возникла проблема, когда я хочу оценить модель на наборе данных проверки. Вот фрагмент кода проблемы: < /p>

Код: Выделить всё

def evaluate(self, epoch_num=None, keep_all=True):
print("self.model:", self.model)

self.model = self.model.eval()
print("self.model after eval:", self.model)
< /code>
Тогда выходной журнал: < /p>
self.model: DeepSpeedEngine(
(module): TSTransformerEncoder(
(project_inp): Linear(in_features=6, out_features=128, bias=True)
(pos_enc): LearnablePositionalEncoding(
(dropout): Dropout(p=0.1, inplace=False)
)
(transformer_encoder): TransformerEncoder(
(layers): ModuleList(
(0-2): 3 x TransformerBatchNormEncoderLayer(
(self_attn): MultiheadAttention(
(out_proj): NonDynamicallyQuantizableLinear(in_features=128, out_features=128, bias=True)
)
(linear1): Linear(in_features=128, out_features=256, bias=True)
(dropout): Dropout(p=0.1, inplace=False)
(linear2): Linear(in_features=256, out_features=128, bias=True)
(norm1): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(norm2): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(dropout1): Dropout(p=0.1, inplace=False)
(dropout2): Dropout(p=0.1, inplace=False)
)
)
)
(output_layer): Linear(in_features=128, out_features=6, bias=True)
(dropout1): Dropout(p=0.1, inplace=False)
)
)
self.model after eval: None
< /code>
Без использования инструмента DeepSpeed модель может быть обучена и оценена нормально. Однако после использования DeepSpeed возникает выше задача.    model, optimizer, _, _ = deepspeed.initialize(
model=model,
optimizer=optimizer,
config_params=ds_config
)
< /code>
Файл ds_config: < /p>
{
"fp16": {
"enabled": true,
"loss_scale": 0,
"loss_scale_window": 1000,
"initial_scale_power": 16,
"hysteresis": 2,
"min_loss_scale": 1
},

"optimizer": {
"params": {
"lr": 0.001,
"weight_decay": 0,
"optimizer_class": "optimizers.RAdam"
}
},

"zero_optimization": {
"stage": 1,
"overlap_comm": true,
"contiguous_gradients": true
},

"zero_allow_untested_optimizer": true,
"train_batch_size": 256,
"steps_per_print": 2000,
"wall_clock_breakdown": false
}

Анализ проблем
Я первоначально ожидал, что self.model.eval () только установит модель только в режим оценки, и сама модель не станет ни одной . Тем не менее, фактический вывод показывает, что Self.Model не становится после вызова метода eval () . I suspect that this might be related to the encapsulation or configuration of DeepSpeed, but I'm not sure about the specific cause.
Relevant Environment Information

Python Version: 3.8.20
PyTorch Версия : 2.4.1
версия DeepSpeed : 0.16.4

Подробнее здесь: https://stackoverflow.com/questions/795 ... -deepspeed

1742074162

Anonymous

 Когда я хочу ускорить обучение модели с помощью DeepSpeed, возникла проблема, когда я хочу оценить модель на наборе данных проверки. Вот фрагмент кода проблемы: < /p>
[code]def evaluate(self, epoch_num=None, keep_all=True):
print("self.model:", self.model)

self.model = self.model.eval()
print("self.model after eval:", self.model)
< /code>
Тогда выходной журнал: < /p>
self.model: DeepSpeedEngine(
(module): TSTransformerEncoder(
(project_inp): Linear(in_features=6, out_features=128, bias=True)
(pos_enc): LearnablePositionalEncoding(
(dropout): Dropout(p=0.1, inplace=False)
)
(transformer_encoder): TransformerEncoder(
(layers): ModuleList(
(0-2): 3 x TransformerBatchNormEncoderLayer(
(self_attn): MultiheadAttention(
(out_proj): NonDynamicallyQuantizableLinear(in_features=128, out_features=128, bias=True)
)
(linear1): Linear(in_features=128, out_features=256, bias=True)
(dropout): Dropout(p=0.1, inplace=False)
(linear2): Linear(in_features=256, out_features=128, bias=True)
(norm1): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(norm2): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
(dropout1): Dropout(p=0.1, inplace=False)
(dropout2): Dropout(p=0.1, inplace=False)
)
)
)
(output_layer): Linear(in_features=128, out_features=6, bias=True)
(dropout1): Dropout(p=0.1, inplace=False)
)
)
self.model after eval: None
< /code>
Без использования инструмента DeepSpeed модель может быть обучена и оценена нормально. Однако после использования DeepSpeed возникает выше задача.    model, optimizer, _, _ = deepspeed.initialize(
model=model,
optimizer=optimizer,
config_params=ds_config
)
< /code>
Файл ds_config: < /p>
{
"fp16": {
"enabled": true,
"loss_scale": 0,
"loss_scale_window": 1000,
"initial_scale_power": 16,
"hysteresis": 2,
"min_loss_scale": 1
},

"optimizer": {
"params": {
"lr": 0.001,
"weight_decay": 0,
"optimizer_class": "optimizers.RAdam"
}
},

"zero_optimization": {
"stage": 1,
"overlap_comm": true,
"contiguous_gradients": true
},

"zero_allow_untested_optimizer": true,
"train_batch_size": 256,
"steps_per_print": 2000,
"wall_clock_breakdown": false
}
[/code]
 Анализ проблем 
Я первоначально ожидал, что self.model.eval ()  только установит модель только в режим оценки, и сама модель не станет ни одной . Тем не менее, фактический вывод показывает, что Self.Model  не становится  после вызова метода eval () . I suspect that this might be related to the encapsulation or configuration of DeepSpeed, but I'm not sure about the specific cause.
Relevant Environment Information
[list]
[*][b]Python Version[/b]: 3.8.20

[*][b]PyTorch Версия [/b]: 2.4.1 

[*]  [b] версия DeepSpeed [/b]: 0.16.4 

[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/79511518/model-eval-return-a-nonetype-object-when-using-deepspeed[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как исправить ошибку: «base_model.model.model.model.embed_tokens» означает при использовании peftModel в Python? (FinGPT

Последнее сообщение Anonymous « 15 июл 2024, 01:36
Добавлено в форуме Python

Anonymous » 15 июл 2024, 01:36 » в форуме Python

Я пытаюсь использовать пример кода из FinGPTForecaster. Я создал токен Huggingface и вошел в Huggingface из строки cmd (Windows 11). Пример кода, скопированный с
Воспроизведенный здесь пример кода выглядит следующим образом:
from datasets import...

0 Ответы

109 Просмотры

Последнее сообщение Anonymous
15 июл 2024, 01:36
Window.eval () работает, но Eval не отображается как свойство окна объекта? [дублировать]

Последнее сообщение Anonymous « 08 фев 2025, 20:10
Добавлено в форуме Javascript

Anonymous » 08 фев 2025, 20:10 » в форуме Javascript

Я заметил, что функция eval () в JavaScript не указана в качестве свойства объекта Window , хотя она все еще доступна, вызывая window.eval () . Почему это? JS Lang-Js PrettyPrint-Override > listKeys(document.getElementById( container ), globalThis);...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
08 фев 2025, 20:10
Подкласс Keras Model HDF5 (.keras). Ошибка сохранения формата при использовании tf.keras.Model.save() — TypeError: непод

Последнее сообщение Anonymous « 27 сен 2024, 16:58
Добавлено в форуме Python

Anonymous » 27 сен 2024, 16:58 » в форуме Python

Проблема
У меня есть подкласс модели tensorflow.keras.Model Seq2Seq с пользовательскими слоями, которая выдает следующую ошибку, когда я пытаюсь сохранить ее через tensorflow.keras.Model .save():
Traceback (most recent call last):
File...

0 Ответы

52 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 16:58
Deepspeed: AttributeError: объект «DummyOptim» не имеет атрибута «шаг».

Последнее сообщение Anonymous « 08 июл 2024, 20:50
Добавлено в форуме Python

Anonymous » 08 июл 2024, 20:50 » в форуме Python

Я хочу использовать deepspeed для обучения LLM вместе с Huggingface Trainer. Но когда я использую deepspeed вместе с тренером, я получаю ошибку «AttributeError: у объекта 'DummyOptim' нет атрибута 'step'». Ниже мой код
import argparse
import numpy...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
08 июл 2024, 20:50
Model.eval на предварительно обученном YOLOv8 вызывает загрузку наборов данных

Последнее сообщение Anonymous « 09 окт 2024, 14:32
Добавлено в форуме Python

Anonymous » 09 окт 2024, 14:32 » в форуме Python

Я хочу использовать предварительно обученный YOLOv8n. Поэтому после импорта модели я хочу перевести ее в режим оценки ( model.eval). Однако вместо обычного запуска программы (как это было в случае, когда я не запустил model.eval ), она загружает...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 14:32

Вернуться в «Python»