Базовый save_pretrained/from_pretrained не извлекает ту же модель, которая была сохранена - Трансформеры

Базовый save_pretrained/from_pretrained не извлекает ту же модель, которая была сохранена - Трансформеры ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Базовый save_pretrained/from_pretrained не извлекает ту же модель, которая была сохранена - Трансформеры

Цитата

Сообщение Anonymous » 26 апр 2024, 18:44

Я создал свою модель с помощью:

Код: Выделить всё

#Load of the model
model_checkpoint = 'microsoft/deberta-v3-large'
# model_checkpoint = 'roberta-base' # you can alternatively use roberta-base but this model is bigger thus training will take longer

# Define label maps specific to your task
id2label = {0: "Human", 1: "AI"}
label2id = {"Human": 0, "AI": 1}

# Generate classification model from model_checkpoint with the defined labels
model = AutoModelForSequenceClassification.from_pretrained(
model_checkpoint, num_labels=2, id2label=id2label, label2id=label2id)

peft_config = LoraConfig(task_type="SEQ_CLS",
r=1,
lora_alpha=16,
lora_dropout=0.2)

model = get_peft_model(model, peft_config)

Это работает нормально, и я вызываю Train.train() для обучения моей модели.
Когда я закончу, я хочу сохранить модель для экспорта его на другую машину, с

Код: Выделить всё

model_path = "./deberta-v3-large-5"
model.save_pretrained(model_path)

И перезагрузите модель с помощью

Код: Выделить всё

reloaded_model = AutoModelForSequenceClassification.from_pretrained(
model_path, num_labels=2, id2label=id2label, label2id=label2id)

Должно быть что-то очень простое, но я могу это понять.
Если я запускаю тесты на своей reloaded_model, я получаю гораздо худшую точность, чем на исходная модель, которая была обучена
Я тоже пробовал, но безуспешно:

Код: Выделить всё

# Save the model and the tokenizer
model_path = "./deberta-v3-large-4"
trainer.save_model(model_path)
tokenizer.save_pretrained(model_path, set_lower_case=False)

from transformers import AutoModelForSequenceClassification, AutoTokenizer

# Path where the model and tokenizer were saved
model_path = "./deberta-v3-large-4"

# Define label maps specific to your task
id2label = {0: "Human", 1: "AI"}
label2id = {"Human": 0, "AI": 1}

# Generate classification model from model_checkpoint with the defined labels
model_regenerate = AutoModelForSequenceClassification.from_pretrained(
model_path, num_labels=2, id2label=id2label, label2id=label2id)

tokenizer_reloaded = AutoTokenizer.from_pretrained(model_path)

peft_config = LoraConfig(task_type="SEQ_CLS",
r=1,
lora_alpha=16,
lora_dropout=0.2)
model_full_regenerate = get_peft_model(model_regenerate, peft_config)
model_full_regenerate.print_trainable_parameters()

Во всех случаях, когда я загружаю модель, я получаю

Код: Выделить всё

Some weights of DebertaV2ForSequenceClassification were not initialized from the model checkpoint at microsoft/deberta-v3-large and are newly initialized: ['classifier.bias', 'classifier.weight', 'pooler.dense.bias', 'pooler.dense.weight']

Спасибо

Подробнее здесь: https://stackoverflow.com/questions/783 ... that-was-s

1714146275

Anonymous

Я создал свою модель с помощью:
[code]#Load of the model
model_checkpoint = 'microsoft/deberta-v3-large'
# model_checkpoint = 'roberta-base' # you can alternatively use roberta-base but this model is bigger thus training will take longer

# Define label maps specific to your task
id2label = {0: "Human", 1: "AI"}
label2id = {"Human": 0, "AI": 1}

# Generate classification model from model_checkpoint with the defined labels
model = AutoModelForSequenceClassification.from_pretrained(
model_checkpoint, num_labels=2, id2label=id2label, label2id=label2id)

peft_config = LoraConfig(task_type="SEQ_CLS",
r=1,
lora_alpha=16,
lora_dropout=0.2)

model = get_peft_model(model, peft_config)
[/code]
Это работает нормально, и я вызываю Train.train() для обучения моей модели.
Когда я закончу, я хочу сохранить модель для экспорта его на другую машину, с
[code]model_path = "./deberta-v3-large-5"
model.save_pretrained(model_path)
[/code]
И перезагрузите модель с помощью 
[code]reloaded_model = AutoModelForSequenceClassification.from_pretrained(
model_path, num_labels=2, id2label=id2label, label2id=label2id)
[/code]
Должно быть что-то очень простое, но я могу это понять.
Если я запускаю тесты на своей reloaded_model, я получаю гораздо худшую точность, чем на исходная модель, которая была обучена
Я тоже пробовал, но безуспешно:
[code]# Save the model and the tokenizer
model_path = "./deberta-v3-large-4"
trainer.save_model(model_path)
tokenizer.save_pretrained(model_path, set_lower_case=False)

from transformers import AutoModelForSequenceClassification, AutoTokenizer

# Path where the model and tokenizer were saved
model_path = "./deberta-v3-large-4"

# Define label maps specific to your task
id2label = {0: "Human", 1: "AI"}
label2id = {"Human": 0, "AI": 1}

# Generate classification model from model_checkpoint with the defined labels
model_regenerate = AutoModelForSequenceClassification.from_pretrained(
model_path, num_labels=2, id2label=id2label, label2id=label2id)

tokenizer_reloaded = AutoTokenizer.from_pretrained(model_path)

peft_config = LoraConfig(task_type="SEQ_CLS",
r=1,
lora_alpha=16,
lora_dropout=0.2)
model_full_regenerate = get_peft_model(model_regenerate, peft_config)
model_full_regenerate.print_trainable_parameters()
[/code]
Во всех случаях, когда я загружаю модель, я получаю
[code]Some weights of DebertaV2ForSequenceClassification were not initialized from the model checkpoint at microsoft/deberta-v3-large and are newly initialized: ['classifier.bias', 'classifier.weight', 'pooler.dense.bias', 'pooler.dense.weight']
[/code]
Спасибо 

Подробнее здесь: [url]https://stackoverflow.com/questions/78391553/basic-save-pretrained-from-pretrained-not-retrieving-the-same-model-that-was-s[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как загрузить TensorFlow модель в 2.19.0, если модель была сохранена в 2.4.1

Последнее сообщение Anonymous « 21 апр 2025, 19:26
Добавлено в форуме Python

Anonymous » 21 апр 2025, 19:26 » в форуме Python

Я пытался перенести одну из 2D моделей UNET, которые я обучал на кластере моей школы, которая поддерживает 2.4.1 TensorFlow до моего личного устройства, которое использует 2.19.0, и должен использовать Python 3.10 для поддержки пакета Agent Agent...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
21 апр 2025, 19:26
Как загрузить TensorFlow модель в 2.19.0, если модель была сохранена в 2.4.1

Последнее сообщение Anonymous « 21 апр 2025, 20:32
Добавлено в форуме Python

Anonymous » 21 апр 2025, 20:32 » в форуме Python

Я пытался перенести одну из 2D моделей UNET, которые я обучал на кластере моей школы, которая поддерживает 2.4.1 TensorFlow до моего личного устройства, которое использует 2.19.0, и должен использовать Python 3.10 для поддержки пакета Agent Agent...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
21 апр 2025, 20:32
EF Core, связанная с ними, не сохранена

Последнее сообщение Anonymous « 09 мар 2025, 10:05
Добавлено в форуме C#

Anonymous » 09 мар 2025, 10:05 » в форуме C#

У меня есть настройка EF Core, где в классе у меня есть навигационное свойство. Насколько я могу судить, я следовал примерам от Microsoft до точки, однако моя добавленная сущность не сохраняется. /> После большого количества копаний в течение...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
09 мар 2025, 10:05
Angular + API REST: Как подтвердить, была ли регистрация пользователя фактически сохранена?

Последнее сообщение Anonymous « 03 апр 2025, 03:38
Добавлено в форуме Javascript

Anonymous » 03 апр 2025, 03:38 » в форуме Javascript

Я разрабатываю угловое приложение, которое регистрирует пользователей в API REST. Проблема заключается в том, что после вызова API я получаю 200 (OK) ответ с, казалось бы, достоверными данными, но когда я снова перечисляю пользователей, вновь...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
03 апр 2025, 03:38
Электронная почта проверки не сохранена в папке времени выполнения/почты

Последнее сообщение Anonymous « 28 июн 2025, 23:16
Добавлено в форуме Php

Anonymous » 28 июн 2025, 23:16 » в форуме Php

Недавно я установил свежую установку Linux со стеком ламп (W/PHP8). Я установил Composer2. Я создал Advanced-App, используя инструкции, предоставленные на сайте YII. Ran init файл (производство). Сделал DB и т. Д. Так, в основном, чистая/по...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
28 июн 2025, 23:16

Вернуться в «Python»