Трансформатор предложений с тонкой настройкой с одним предложением и данными метки

Трансформатор предложений с тонкой настройкой с одним предложением и данными метки ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Трансформатор предложений с тонкой настройкой с одним предложением и данными метки

Цитата

Сообщение Anonymous » 12 мар 2025, 01:58

Я пытаюсь точно настроить модель трансформатора предложений. Данные, которые я имею, содержит ниже столбцы: < /p>

raw_text - необработанные куски текста < /li>
Метка - соответствующая метка для текста - true или false. (1 или 0) < /li>
< /ol>
Я хотел точно настроить модель трансформатора предложений, так что встроенные встроения оптимизированы так, чтобы все истинные предложения были ближе в векторном пространстве, чем все ложные предложения. Какая потеря для моего типа данных и использования. Я склоняюсь к ниже:

, так как он соответствует моим формату данных. Когда я читал больше об этих потерях и о том, как они вычисляются с использованием якорных, положительных и отрицательных образцов, я чувствую себя менее уверенно в их использовании, поскольку мои данные не имеют такого рода пары.from sentence_transformers import SentenceTransformer, InputExample, SentencesDataset, LoggingHandler, losses
from torch.utils.data import DataLoader
import pandas as pd

# Load a pre-trained Sentence Transformer model
# model = SentenceTransformer('stsb-roberta-base') #Hugging face says this model produces embeddings of low quality
model = SentenceTransformer('all-mpnet-base-v2')

# Assume 'transportation_data' is your dataset containing 'page_raw_text' and 'is_practical' columns
data = pd.DataFrame({'text': train_data['page_raw_text'], 'label': train_data['label']})

# Create InputExample objects
examples = [InputExample(texts=[txt], label=label) for txt, label in zip(data['text'], data['label'])]

# Create a DataLoader object and a Loss model
train_dataset = SentencesDataset(examples=examples, model=model)
train_dataloader = DataLoader(train_dataset, shuffle=True, batch_size=8)
train_loss = losses.BatchAllTripletLoss(model=model)

# Define your training arguments
num_epochs = 10
evaluation_steps = 1

model.fit(train_objectives=[(train_dataloader, train_loss)], epochs=num_epochs,evaluation_steps=1)

Подробнее здесь: https://stackoverflow.com/questions/781 ... label-data

1741733901

Anonymous

 Я пытаюсь точно настроить модель трансформатора предложений. Данные, которые я имею, содержит ниже столбцы: < /p>

 raw_text - необработанные куски текста < /li>
 Метка - соответствующая метка для текста - true или false. (1 или 0) < /li>
< /ol>
Я хотел точно настроить модель трансформатора предложений, так что встроенные встроения оптимизированы так, чтобы все истинные предложения были ближе в векторном пространстве, чем все ложные предложения. Какая потеря для моего типа данных и использования. Я склоняюсь к ниже: 
 
, так как он соответствует моим формату данных. Когда я читал больше об этих потерях и о том, как они вычисляются с использованием якорных, положительных и отрицательных образцов, я чувствую себя менее уверенно в их использовании, поскольку мои данные не имеют такого рода пары.from sentence_transformers import SentenceTransformer, InputExample, SentencesDataset, LoggingHandler, losses
from torch.utils.data import DataLoader
import pandas as pd

# Load a pre-trained Sentence Transformer model
# model = SentenceTransformer('stsb-roberta-base') #Hugging face says this model produces embeddings of low quality
model = SentenceTransformer('all-mpnet-base-v2')

# Assume 'transportation_data' is your dataset containing 'page_raw_text' and 'is_practical' columns
data = pd.DataFrame({'text': train_data['page_raw_text'], 'label': train_data['label']})

# Create InputExample objects
examples = [InputExample(texts=[txt], label=label) for txt, label in zip(data['text'], data['label'])]

# Create a DataLoader object and a Loss model
train_dataset = SentencesDataset(examples=examples, model=model)
train_dataloader = DataLoader(train_dataset, shuffle=True, batch_size=8)
train_loss = losses.BatchAllTripletLoss(model=model)

# Define your training arguments
num_epochs = 10
evaluation_steps = 1

model.fit(train_objectives=[(train_dataloader, train_loss)], epochs=num_epochs,evaluation_steps=1)

 

Подробнее здесь: [url]https://stackoverflow.com/questions/78148092/fine-tune-sentence-transformer-with-single-sentence-and-label-data[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Трансформатор предложений с тонкой настройкой с одним предложением и данными метки

Последнее сообщение Anonymous « 12 мар 2025, 02:28
Добавлено в форуме Python

Anonymous » 12 мар 2025, 02:28 » в форуме Python

Я пытаюсь точно настроить модель трансформатора предложений. Данные, которые я имею, содержит ниже столбцы:

raw_text - необработанные куски текста
Метка - соответствующая метка для текста - true или false. (1 или 0)

Я хотел точно настроить...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
12 мар 2025, 02:28
Проблемы с тонкой настройкой чатгпта для использования его в чат-боте колледжа

Последнее сообщение Anonymous « 06 окт 2024, 15:04
Добавлено в форуме Python

Anonymous » 06 окт 2024, 15:04 » в форуме Python

Я не могу выполнить тонкую настройку... все методы я не могу их применить
Мне нужен надежный метод
Я пробовал много методов с YouTube, но
все они — ошибки git.
Мне нужен код для использования в Google Colab.
Или предоставьте мне сайты, которые...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
06 окт 2024, 15:04
Проблема с тонкой настройкой ламы с несколькими графическими процессорами. Ошибка выполнения: ожидалось, что все тензоры

Последнее сообщение Anonymous « 28 ноя 2024, 13:55
Добавлено в форуме Python

Anonymous » 28 ноя 2024, 13:55 » в форуме Python

Я работаю над задачей по тонкой настройке ламы. Когда я тренируюсь на одном графическом процессоре, программа работает нормально.
import os
os.environ = 0
os.environ = false
device = torch.device( cuda:0 if torch.cuda.is_available() else cpu )...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
28 ноя 2024, 13:55
ATTRIBUTERROR: объект 'clipimageProcessor' не имеет атрибута «patch_size» при загрузке модели Llava с тонкой настройкой

Последнее сообщение Anonymous « 31 янв 2025, 21:45
Добавлено в форуме Python

Anonymous » 31 янв 2025, 21:45 » в форуме Python

Я имею тонкую настройку модели Llava (большой язык и видение) в Google Colab и сохранил ее на моем Google Drive. Вот как я сохранил модель:
'' '
from google.colab import drive
drive.mount('/content/drive', force_remount=True)
import os

save_path...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
31 янв 2025, 21:45
ATTRIBUTERROR: объект 'clipimageProcessor' не имеет атрибута «patch_size» при загрузке модели Llava с тонкой настройкой

Последнее сообщение Anonymous « 01 фев 2025, 01:30
Добавлено в форуме Python

Anonymous » 01 фев 2025, 01:30 » в форуме Python

Я имею тонкую настройку модели Llava (большой язык и видение) в Google Colab и сохранил ее на моем Google Drive. Вот как я сохранил модель:
from google.colab import drive
drive.mount('/content/drive', force_remount=True)
import os

save_path =...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
01 фев 2025, 01:30

Вернуться в «Python»