Общая информация
Я пытаюсь обучить LLM с помощью LLama3 в наборе данных языка stackoverflow c.
Код: Выделить всё
LLm - meta-llama/Meta-Llama-3-8B
Dataset - Mxode/StackOverflow-QA-C-Language-40k
Код: Выделить всё
DatasetDict({
train: Dataset({
features: ['question', 'answer'],
num_rows: 40649
})
})
Код: Выделить всё
trainer = SFTTrainer(
model=model,
train_dataset=dataset["train"],
eval_dataset=dataset["validation"],
peft_config=peft_config,
dataset_text_field="question", # Specify the text field in the dataset
Подробнее здесь: [url]https://stackoverflow.com/questions/78688141/how-to-choose-dataset-text-field-in-sfttrainer-hugging-face-for-my-llm-model[/url]