TypeError: sfttrainer .__ init __ () Получил неожиданный аргумент ключевого слова 'dateSet_text_field'

TypeError: sfttrainer . init () Получил неожиданный аргумент ключевого слова 'dateSet_text_field' ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

TypeError: sfttrainer .__ init __ () Получил неожиданный аргумент ключевого слова 'dateSet_text_field'

Цитата

Сообщение Anonymous » 15 мар 2025, 00:09

Я пытаюсь точно настроить языковую модель, используя SftTrainer из библиотеки TRL в Google Colab. Тем не менее, я сталкиваюсь с следующей ошибкой: < /p>

Код: Выделить всё

TypeError                                 Traceback (most recent call last)
 in ()
53
54
---> 55 trainer = SFTTrainer(
56         model=model,
57         train_dataset=data,

/usr/local/lib/python3.11/dist-packages/transformers/utils/deprecation.py in wrapped_func(*args, **kwargs)
170                 warnings.warn(message, FutureWarning, stacklevel=2)
171
--> 172             return func(*args, **kwargs)
173
174         return wrapped_func

TypeError: SFTTrainer.__init__() got an unexpected keyword argument 'dataset_text_field'

code:
import torch
from datasets import load_dataset, Dataset
from peft import LoraConfig, AutoPeftModelForCausalLM, prepare_model_for_kbit_training, get_peft_model
from transformers import AutoModelForCausalLM, AutoTokenizer, GPTQConfig, TrainingArguments
from trl import SFTTrainer
import os

# Load dataset
data = load_dataset("tatsu-lab/alpaca", split="train")
data_df = data.to_pandas()
data_df = data_df[:5000]
data_df["text"] = data_df[["input", "instruction", "output"]].apply(lambda x: "###Human: " + x["instruction"] + " " + x["input"] + " ###Assistant: "+ x["output"], axis=1)
data = Dataset.from_pandas(data_df)

# Load tokenizer
tokenizer = AutoTokenizer.from_pretrained("TheBloke/Mistral-7B-Instruct-v0.1-GPTQ")
tokenizer.pad_token = tokenizer.eos_token

# Load model
quantization_config_loading = GPTQConfig(bits=4, disable_exllama=True, tokenizer=tokenizer)
model = AutoModelForCausalLM.from_pretrained(
"TheBloke/Mistral-7B-Instruct-v0.1-GPTQ",
quantization_config=quantization_config_loading,
device_map="auto"
)

model.config.use_cache = False
model.config.pretraining_tp = 1
model.gradient_checkpointing_enable()
model = prepare_model_for_kbit_training(model)

# Apply LoRA configuration
peft_config = LoraConfig(
r=16, lora_alpha=16, lora_dropout=0.05, bias="none", task_type="CAUSAL_LM", target_modules=["q_proj", "v_proj"]
)
model = get_peft_model(model, peft_config)

# Training arguments
training_arguments = TrainingArguments(
output_dir="mistral-finetuned-alpaca",
per_device_train_batch_size=8,
gradient_accumulation_steps=1,
optim="paged_adamw_32bit",
learning_rate=2e-4,
lr_scheduler_type="cosine",
save_strategy="epoch",
logging_steps=100,
num_train_epochs=1,
max_steps=250,
fp16=True,
push_to_hub=True
)

# Initialize Trainer
trainer = SFTTrainer(
model=model,
train_dataset=data,
peft_config=peft_config,
dataset_text_field="text", # This argument is causing the error
args=training_arguments,
tokenizer=tokenizer,
packing=False,
max_seq_length=512
)

trainer.train()
< /code>
Что я пробовал: < /strong> < /h1>

[*] Проверьте документацию sfttrainer, чтобы подтвердить, является ли Dataset_text_field. Правильно для sfttrainer. < /li>
< /ol>
Вопрос: < /strong> < /h1>

Dataet_text_field не нужен в Sfttrainer? Sfttrainer?

Подробнее здесь: https://stackoverflow.com/questions/795 ... ataset-tex

1741986585

Anonymous

 Я пытаюсь точно настроить языковую модель, используя SftTrainer из библиотеки TRL в Google Colab. Тем не менее, я сталкиваюсь с следующей ошибкой: < /p>
[code]TypeError                                 Traceback (most recent call last)
 in ()
53
54
---> 55 trainer = SFTTrainer(
56         model=model,
57         train_dataset=data,

/usr/local/lib/python3.11/dist-packages/transformers/utils/deprecation.py in wrapped_func(*args, **kwargs)
170                 warnings.warn(message, FutureWarning, stacklevel=2)
171
--> 172             return func(*args, **kwargs)
173
174         return wrapped_func

TypeError: SFTTrainer.__init__() got an unexpected keyword argument 'dataset_text_field'
[/code]
 [b] code: [/b] 
import torch
from datasets import load_dataset, Dataset
from peft import LoraConfig, AutoPeftModelForCausalLM, prepare_model_for_kbit_training, get_peft_model
from transformers import AutoModelForCausalLM, AutoTokenizer, GPTQConfig, TrainingArguments
from trl import SFTTrainer
import os

# Load dataset
data = load_dataset("tatsu-lab/alpaca", split="train")
data_df = data.to_pandas()
data_df = data_df[:5000]
data_df["text"] = data_df[["input", "instruction", "output"]].apply(lambda x: "###Human: " + x["instruction"] + " " + x["input"] + " ###Assistant: "+ x["output"], axis=1)
data = Dataset.from_pandas(data_df)

# Load tokenizer
tokenizer = AutoTokenizer.from_pretrained("TheBloke/Mistral-7B-Instruct-v0.1-GPTQ")
tokenizer.pad_token = tokenizer.eos_token

# Load model
quantization_config_loading = GPTQConfig(bits=4, disable_exllama=True, tokenizer=tokenizer)
model = AutoModelForCausalLM.from_pretrained(
"TheBloke/Mistral-7B-Instruct-v0.1-GPTQ",
quantization_config=quantization_config_loading,
device_map="auto"
)

model.config.use_cache = False
model.config.pretraining_tp = 1
model.gradient_checkpointing_enable()
model = prepare_model_for_kbit_training(model)

# Apply LoRA configuration
peft_config = LoraConfig(
r=16, lora_alpha=16, lora_dropout=0.05, bias="none", task_type="CAUSAL_LM", target_modules=["q_proj", "v_proj"]
)
model = get_peft_model(model, peft_config)

# Training arguments
training_arguments = TrainingArguments(
output_dir="mistral-finetuned-alpaca",
per_device_train_batch_size=8,
gradient_accumulation_steps=1,
optim="paged_adamw_32bit",
learning_rate=2e-4,
lr_scheduler_type="cosine",
save_strategy="epoch",
logging_steps=100,
num_train_epochs=1,
max_steps=250,
fp16=True,
push_to_hub=True
)

# Initialize Trainer
trainer = SFTTrainer(
model=model,
train_dataset=data,
peft_config=peft_config,
dataset_text_field="text",  # This argument is causing the error
args=training_arguments,
tokenizer=tokenizer,
packing=False,
max_seq_length=512
)

trainer.train()
< /code>
  Что я пробовал: < /strong> < /h1>

[*] Проверьте документацию sfttrainer, чтобы подтвердить, является ли Dataset_text_field. Правильно для sfttrainer. < /li>
< /ol>
  Вопрос: < /strong> < /h1>
[list]
 Dataet_text_field не нужен в Sfttrainer? Sfttrainer?
[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/79509805/typeerror-sfttrainer-init-got-an-unexpected-keyword-argument-dataset-tex[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

TypeError в SFTTrainer инициализации: неожиданный аргумент ключевого слова «Tokenizer»

Последнее сообщение Anonymous « 31 мар 2025, 21:06
Добавлено в форуме Python

Anonymous » 31 мар 2025, 21:06 » в форуме Python

Вопрос:
Я пытаюсь точно настроить модель Mistral-7b-instruct-v0.1-gptq с использованием sfttrainer из TRL. Однако при запуске моего скрипта в Google Colab я сталкиваюсь с следующей ошибкой:
TypeError: SFTTrainer.__init__() got an unexpected keyword...

0 Ответы

55 Просмотры

Последнее сообщение Anonymous
31 мар 2025, 21:06
TypeError: AsyncClient .__ init __ () Получил неожиданный аргумент ключевого слова «прокси»

Последнее сообщение Anonymous « 13 фев 2025, 23:52
Добавлено в форуме Python

Anonymous » 13 фев 2025, 23:52 » в форуме Python

Ошибка:
File /app/.venv/lib/python3.11/site-packages/anthropic/_client.py , line 386, in __init__
super().__init__(
File /app/.venv/lib/python3.11/site-packages/anthropic/_base_client.py , line 1437, in __init__
self._client = http_client or...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
13 фев 2025, 23:52
TypeError: AsyncClient .__ init __ () Получил неожиданный аргумент ключевого слова «прокси»

Последнее сообщение Anonymous « 20 фев 2025, 17:26
Добавлено в форуме Python

Anonymous » 20 фев 2025, 17:26 » в форуме Python

Ошибка:
File /app/.venv/lib/python3.11/site-packages/anthropic/_client.py , line 386, in __init__
super().__init__(
File /app/.venv/lib/python3.11/site-packages/anthropic/_base_client.py , line 1437, in __init__
self._client = http_client or...

0 Ответы

47 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 17:26
TypeError: AsyncClient .__ init __ () Получил неожиданный аргумент ключевого слова «прокси»

Последнее сообщение Anonymous « 24 фев 2025, 12:14
Добавлено в форуме Python

Anonymous » 24 фев 2025, 12:14 » в форуме Python

Ошибка:
File /app/.venv/lib/python3.11/site-packages/anthropic/_client.py , line 386, in __init__
super().__init__(
File /app/.venv/lib/python3.11/site-packages/anthropic/_base_client.py , line 1437, in __init__
self._client = http_client or...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 12:14
OpenPyxl TypeError: SheetFormatProperties .__ init __ () Получил неожиданный аргумент ключевого слова

Последнее сообщение Anonymous « 03 апр 2025, 08:45
Добавлено в форуме Python

Anonymous » 03 апр 2025, 08:45 » в форуме Python

def manytoonebyspire():
import openpyxl
from spire.xls import Workbook
from spire.xls import ExcelVersion
workbook=Workbook()
workbook.LoadFromFile('manysheetbook.xlsx')
workbook1=Workbook()
workbook1.CreateEmptySheets(1)
i=0
for sheet in...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
03 апр 2025, 08:45

Вернуться в «Python»

TypeError: sfttrainer .__ init __ () Получил неожиданный аргумент ключевого слова 'dateSet_text_field' ⇐ Python

Быстрый ответ

TypeError: sfttrainer . init () Получил неожиданный аргумент ключевого слова 'dateSet_text_field' ⇐ Python