Добавление метрик точности, отзыва и f1 в SFTTrainer

Добавление метрик точности, отзыва и f1 в SFTTrainer ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Добавление метрик точности, отзыва и f1 в SFTTrainer

Цитата

Сообщение Anonymous » 14 окт 2024, 23:37

Я работаю над точной настройкой LLM с помощью SFTTrainer.
По какой-то причине на этапе проверки он выдает только eval_loss.
Хотя это хорошо, меня действительно интересовали и другие показатели (например, точность), но я пока не смог понять, как это сделать.
Я видел много примеры для класса Trainer, и я знаю, что SFTTrainer поддерживает параметр Compute_metrics в своем методе __init__, но мне не удалось соединить все части вместе.Быстрый просмотр обнаружил на GitHub следующие проблемы: https://github.com/huggingface/trl/issues/862 и https://github.com/huggingface/trl/issues/862
Как бы то ни было, мой набор данных отформатирован следующим образом:

Train ==> приглашение + данные + ответ

Train ==> приглашение + данные + ответ

li>
Оценка ==> приглашение + данные + ответ (я знаю, что ответ следует удалить)
Тест ==> приглашение + данные

Здесь создается трейнер:

def create_trainer(self):
train_args = TrainingArguments(
per_device_train_batch_size=2,
gradient_accumulation_steps=2,
warmup_steps=200,
gradient_checkpointing=True,
per_device_eval_batch_size=1,
# num_train_epochs=self.num_of_epochs,
max_steps=10,
learning_rate=2e-4,
fp16=not is_bfloat16_supported(),
bf16=is_bfloat16_supported(),
logging_steps=1,
optim="adamw_8bit",
weight_decay=0.01,
lr_scheduler_type="cosine",
report_to="none",
seed=3407,
output_dir=self.output_dir,
eval_strategy="steps",
eval_steps=0.1,
)

trainer = SFTTrainer(
model=self.model,
compute_metrics=self.compute_metrics,
preprocess_logits_for_metrics=self.preprocess_logits_for_metrics,
tokenizer=self.tokenizer,
train_dataset=self.train_data,
eval_dataset=self.eval_data,
dataset_text_field="text",
max_seq_length=self.max_seq_length,
dataset_num_proc=2,
packing=False, # Can make training 5x faster for short sequences.
args=train_args,
dataset_kwargs={
"add_special_tokens": False,
"append_concat_token": False,
}
)

return trainer

а также
@staticmethod
def preprocess_logits_for_metrics(logits, labels):
"""
Original Trainer may have a memory leak.
This is a workaround to avoid storing too many tensors that are not needed.
"""
pred_ids = torch.argmax(logits[0], dim=-1)
return pred_ids, labels

@staticmethod
def compute_metrics(eval_pred):
# Unpack predictions and labels
predictions, _ = eval_pred.predictions
labels = eval_pred.label_ids

# Flatten labels if necessary
if labels.ndim > 1:
labels = labels.flatten()

# Ensure predictions are in the same format
if predictions.ndim > 1:
predictions = predictions.flatten()

# Remove invalid labels if necessary (e.g., -100)
valid_indices = labels != -100

# Handle size mismatch if needed
if len(predictions) != len(labels):
# You might need to slice or pad arrays here
min_len = min(len(predictions), len(labels))
labels = labels[:min_len]
predictions = predictions[:min_len]
valid_indices = valid_indices[:min_len]

# Filter out invalid indices
labels = labels[valid_indices]
predictions = predictions[valid_indices]

# Calculate accuracy, precision, recall, and F1 score
accuracy = accuracy_score(labels, predictions)
precision, recall, f1, _ = precision_recall_fscore_support(labels, predictions, average='weighted')

return {
'accuracy': accuracy,
'precision': precision,
'recall': recall,
'f1': f1,
}

Подробнее здесь: https://stackoverflow.com/questions/790 ... sfttrainer

1728938270

Anonymous

Я работаю над точной настройкой LLM с помощью SFTTrainer.
По какой-то причине на этапе проверки он выдает только eval_loss.
Хотя это хорошо, меня действительно интересовали и другие показатели (например, точность), но я пока не смог понять, как это сделать.
Я видел много примеры для класса Trainer, и я знаю, что SFTTrainer поддерживает параметр Compute_metrics в своем методе __init__, но мне не удалось соединить все части вместе.Быстрый просмотр обнаружил на GitHub следующие проблемы: https://github.com/huggingface/trl/issues/862 и https://github.com/huggingface/trl/issues/862
Как бы то ни было, мой набор данных отформатирован следующим образом:
[list]
[*]Train ==> приглашение + данные + ответ

Train ==> приглашение + данные + ответ

 li>
Оценка ==> приглашение + данные + ответ (я знаю, что ответ следует удалить)
Тест ==> приглашение + данные
[/list]
Здесь создается трейнер:

def create_trainer(self):
train_args = TrainingArguments(
per_device_train_batch_size=2,
gradient_accumulation_steps=2,
warmup_steps=200,
gradient_checkpointing=True,
per_device_eval_batch_size=1,
# num_train_epochs=self.num_of_epochs,
max_steps=10,
learning_rate=2e-4,
fp16=not is_bfloat16_supported(),
bf16=is_bfloat16_supported(),
logging_steps=1,
optim="adamw_8bit",
weight_decay=0.01,
lr_scheduler_type="cosine",
report_to="none",
seed=3407,
output_dir=self.output_dir,
eval_strategy="steps",
eval_steps=0.1,
)

trainer = SFTTrainer(
model=self.model,
compute_metrics=self.compute_metrics,
preprocess_logits_for_metrics=self.preprocess_logits_for_metrics,
tokenizer=self.tokenizer,
train_dataset=self.train_data,
eval_dataset=self.eval_data,
dataset_text_field="text",
max_seq_length=self.max_seq_length,
dataset_num_proc=2,
packing=False,  # Can make training 5x faster for short sequences.
args=train_args,
dataset_kwargs={
"add_special_tokens": False,
"append_concat_token": False,
}
)

return trainer

а также
    @staticmethod
def preprocess_logits_for_metrics(logits, labels):
"""
Original Trainer may have a memory leak.
This is a workaround to avoid storing too many tensors that are not needed.
"""
pred_ids = torch.argmax(logits[0], dim=-1)
return pred_ids, labels

@staticmethod
def compute_metrics(eval_pred):
# Unpack predictions and labels
predictions, _ = eval_pred.predictions
labels = eval_pred.label_ids

# Flatten labels if necessary
if labels.ndim > 1:
labels = labels.flatten()

# Ensure predictions are in the same format
if predictions.ndim > 1:
predictions = predictions.flatten()

# Remove invalid labels if necessary (e.g., -100)
valid_indices = labels != -100

# Handle size mismatch if needed
if len(predictions) != len(labels):
# You might need to slice or pad arrays here
min_len = min(len(predictions), len(labels))
labels = labels[:min_len]
predictions = predictions[:min_len]
valid_indices = valid_indices[:min_len]

# Filter out invalid indices
labels = labels[valid_indices]
predictions = predictions[valid_indices]

# Calculate accuracy, precision, recall, and F1 score
accuracy = accuracy_score(labels, predictions)
precision, recall, f1, _ = precision_recall_fscore_support(labels, predictions, average='weighted')

return {
'accuracy': accuracy,
'precision': precision,
'recall': recall,
'f1': f1,
}
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79087652/adding-accuracy-recall-and-f1-metrics-to-sfttrainer[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как обновить значение пользовательских метрик на основе других метрик в облачном мониторинге Google?

Последнее сообщение Anonymous « 24 ноя 2024, 04:24
Добавлено в форуме Python

Anonymous » 24 ноя 2024, 04:24 » в форуме Python

Я хочу создать в Google Cloud Monitoring специальную метрику, которая представляет собой временной ряд. Значение будет основано на других существующих показателях (например, «MetricC» — это сумма двух других показателей «MetricA + MetricB»,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
24 ноя 2024, 04:24
Я получаю нулевые значения для средней точности и среднего отзыва при использовании Pycocotools

Последнее сообщение Anonymous « 23 июн 2025, 11:13
Добавлено в форуме Python

Anonymous » 23 июн 2025, 11:13 » в форуме Python

Я пытаюсь оценить производительность модели с использованием пикокотул, необходимо, чтобы вы готовили Bbbobes и обнаружения (DT) (GT) (GT) (DT) в качестве файлов JSON в формате кокосового стиля.
Я много работал над созданием этих файлов JSON и...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
23 июн 2025, 11:13
Повышение точности обучения при колебаниях точности проверки

Последнее сообщение Anonymous « 10 май 2024, 02:24
Добавлено в форуме Python

Anonymous » 10 май 2024, 02:24 » в форуме Python

Я пытаюсь создать модель распознавания действий на языке жестов, у меня есть кадры, которые я преобразовал в ключевые точки ориентиров с помощью Mediapipe, и они находятся в формате .npy, обучение достигает 90 %, но моя проверка достигает 10 %,...

0 Ответы

59 Просмотры

Последнее сообщение Anonymous
10 май 2024, 02:24
Числа с плавающей запятой двойной точности и одинарной точности?

Последнее сообщение Anonymous « 29 сен 2024, 10:33
Добавлено в форуме Python

Anonymous » 29 сен 2024, 10:33 » в форуме Python

Мне было интересно, почему числа двойной и одинарной точности иногда равны, а иногда нет. Например, когда у меня есть следующие значения, они не равны:

import numpy as np

x=np.float64(1./3.)
y=np.float32(1./3.)

но следующие значения равны:...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
29 сен 2024, 10:33
IndexError при создании экземпляра SFTTrainer() для точной настройки Llama2.

Последнее сообщение Anonymous « 29 окт 2023, 19:26
Добавлено в форуме Python

Anonymous » 29 окт 2023, 19:26 » в форуме Python

Я новичок в НЛП и просматриваю руководство по точной настройке Llama2. Я следовал инструкциям, и это сработало хорошо, но я столкнулся с ошибкой IndexError, когда пытался создать экземпляр SFTTrainer() для обучения моей модели. Прежде чем я...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
29 окт 2023, 19:26

Вернуться в «Python»