Как выбрать dataset_text_field в SFTTrainer, обнимающее лицо для моей модели LLMPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как выбрать dataset_text_field в SFTTrainer, обнимающее лицо для моей модели LLM

Сообщение Anonymous »

Примечание: новичок в LLM
Общая информация
Я пытаюсь обучить LLM с помощью LLama3 в наборе данных языка stackoverflow c.

Код: Выделить всё

LLm - meta-llama/Meta-Llama-3-8B
Dataset - Mxode/StackOverflow-QA-C-Language-40k
Структура моего набора данных выглядит так

Код: Выделить всё

DatasetDict({
train: Dataset({
features: ['question', 'answer'],
num_rows: 40649
})
})
Почему DataSet_text_field важен? п>

Код: Выделить всё

trainer = SFTTrainer(
model=model,
train_dataset=dataset["train"],
eval_dataset=dataset["validation"],
peft_config=peft_config,
dataset_text_field="question",  # Specify the text field in the dataset 

Подробнее здесь: [url]https://stackoverflow.com/questions/78688141/how-to-choose-dataset-text-field-in-sfttrainer-hugging-face-for-my-llm-model[/url]
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»