Разные вложения для одних и тех же предложений с факельным трансформатором

Разные вложения для одних и тех же предложений с факельным трансформатором ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Разные вложения для одних и тех же предложений с факельным трансформатором

Цитата

Сообщение Anonymous » 01 июл 2024, 21:53

Привет всем и заранее приношу извинения за, вероятно, довольно простой вопрос: у меня есть теория о том, что вызывает проблему, но было бы здорово подтвердить это с людьми, которые знают об этом больше, чем я.
Я пытался реализовать этот фрагмент кода Python в Google Colab. Фрагмент предназначен для определения сходства предложений. Код работает нормально, но я обнаружил, что вложения и расстояния меняются каждый раз, когда я его запускаю, что не идеально для моего предполагаемого варианта использования.

Код: Выделить всё

import torch
from scipy.spatial.distance import cosine
from transformers import AutoModel, AutoTokenizer

# Import our models. The package will take care of downloading the models automatically
tokenizer = AutoTokenizer.from_pretrained("qiyuw/pcl-bert-base-uncased")
model = AutoModel.from_pretrained("qiyuw/pcl-bert-base-uncased")

# Tokenize input texts
texts = [
"There's a kid on a skateboard.",
"A kid is skateboarding.",
"A kid is inside the house."
]
inputs = tokenizer(texts, padding=True, truncation=True, return_tensors="pt")

# Get the embeddings
with torch.no_grad():
embeddings = model(**inputs, output_hidden_states=True, return_dict=True).pooler_output

# Calculate cosine similarities
# Cosine similarities are in [-1, 1]. Higher means more similar
cosine_sim_0_1 = 1 - cosine(embeddings[0], embeddings[1])
cosine_sim_0_2 = 1 - cosine(embeddings[0], embeddings[2])

print("Cosine similarity between \"%s\" and \"%s\" is: %.3f" % (texts[0], texts[1], cosine_sim_0_1))
print("Cosine similarity between \"%s\" and \"%s\" is: %.3f" % (texts[0], texts[2], cosine_sim_0_2))

Я думаю, что проблема связана с конкретной моделью, поскольку я получаю предупреждение о вновь инициализированных весах пулера, а Pooler_output — это, в конечном счете, то, что код читает, чтобы сообщить о сходстве:

Код: Выделить всё

Some weights of RobertaModel were not initialized from the model checkpoint at qiyuw/pcl-roberta-large and are newly initialized: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.

Переключение на альтернативную модель, которая не выдает этого предупреждения (например, предложения-трансформеры/all-mpnet-base-v2), делает выходные данные воспроизводимыми, поэтому я думаю, что это из-за вышеприведенное предупреждение об инициализации весов. Итак, вот мои вопросы:

Могу ли я сделать вывод воспроизводимым, инициализируя/заполнив модель по-другому?
Если Я не могу сделать выходные данные воспроизводимыми. Есть ли способ повысить точность и уменьшить различия между запусками?
Есть ли способ поиска таких моделей с обнимающими лицами? который будет инициализировать веса пулера, чтобы я мог найти модель, которая соответствует моим целям?

Заранее спасибо

Подробнее здесь: https://stackoverflow.com/questions/786 ... ransformer

1719860032

Anonymous

Привет всем и заранее приношу извинения за, вероятно, довольно простой вопрос: у меня есть теория о том, что вызывает проблему, но было бы здорово подтвердить это с людьми, которые знают об этом больше, чем я.
Я пытался реализовать этот фрагмент кода Python в Google Colab. Фрагмент предназначен для определения сходства предложений. Код работает нормально, но я обнаружил, что вложения и расстояния меняются каждый раз, когда я его запускаю, что не идеально для моего предполагаемого варианта использования.
[code]import torch
from scipy.spatial.distance import cosine
from transformers import AutoModel, AutoTokenizer

# Import our models. The package will take care of downloading the models automatically
tokenizer = AutoTokenizer.from_pretrained("qiyuw/pcl-bert-base-uncased")
model = AutoModel.from_pretrained("qiyuw/pcl-bert-base-uncased")

# Tokenize input texts
texts = [
"There's a kid on a skateboard.",
"A kid is skateboarding.",
"A kid is inside the house."
]
inputs = tokenizer(texts, padding=True, truncation=True, return_tensors="pt")

# Get the embeddings
with torch.no_grad():
embeddings = model(**inputs, output_hidden_states=True, return_dict=True).pooler_output

# Calculate cosine similarities
# Cosine similarities are in [-1, 1]. Higher means more similar
cosine_sim_0_1 = 1 - cosine(embeddings[0], embeddings[1])
cosine_sim_0_2 = 1 - cosine(embeddings[0], embeddings[2])

print("Cosine similarity between \"%s\" and \"%s\" is: %.3f" % (texts[0], texts[1], cosine_sim_0_1))
print("Cosine similarity between \"%s\" and \"%s\" is: %.3f" % (texts[0], texts[2], cosine_sim_0_2))
[/code]
Я думаю, что проблема связана с конкретной моделью, поскольку я получаю предупреждение о вновь инициализированных весах пулера, а Pooler_output — это, в конечном счете, то, что код читает, чтобы сообщить о сходстве:
[code]Some weights of RobertaModel were not initialized from the model checkpoint at qiyuw/pcl-roberta-large and are newly initialized: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
[/code]
Переключение на альтернативную модель, которая не выдает этого предупреждения (например, предложения-трансформеры/all-mpnet-base-v2), делает выходные данные воспроизводимыми, поэтому я думаю, что это из-за вышеприведенное предупреждение об инициализации весов.  Итак, вот мои вопросы:
[list]
[*]Могу ли я сделать вывод воспроизводимым, инициализируя/заполнив модель по-другому?
[*]Если Я не могу сделать выходные данные воспроизводимыми. Есть ли способ повысить точность и уменьшить различия между запусками?
[*]Есть ли способ поиска таких моделей с обнимающими лицами? который будет инициализировать веса пулера, чтобы я мог найти модель, которая соответствует моим целям?
[/list]
Заранее спасибо 

Подробнее здесь: [url]https://stackoverflow.com/questions/78689702/different-embeddings-for-same-sentences-with-torch-transformer[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему две разные модели логистической регрессии дают совершенно разные результаты на одних и тех же исходных данных?

Последнее сообщение Anonymous « 08 дек 2024, 18:41
Добавлено в форуме Python

Anonymous » 08 дек 2024, 18:41 » в форуме Python

Я искал похожие вопросы, но ни один из ответов не соответствует моей конкретной ситуации.
Я работаю с данными НФЛ, прогнозируя результаты игр. Мои исходные данные (используемые для обоих процессов ниже) состоят из примерно 3800 строк по 20 отдельных...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
08 дек 2024, 18:41
Почему две разные модели логистической регрессии дают совершенно разные результаты на одних и тех же исходных данных? [з

Последнее сообщение Anonymous « 08 дек 2024, 21:02
Добавлено в форуме Python

Anonymous » 08 дек 2024, 21:02 » в форуме Python

Я работаю с данными НФЛ и прогнозирую исходы игр. Мои исходные данные (используемые для обоих процессов ниже) состоят из примерно 3800 строк по 20 отдельных характеристик (по десять для каждой команды, плюс дата, идентификатор игры, команда хозяев и...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
08 дек 2024, 21:02
Рандомизация изображений+предложений в дизайне без повторения одних и тех же стимулов на Qualtrics

Последнее сообщение Anonymous « 24 янв 2025, 22:32
Добавлено в форуме Javascript

Anonymous » 24 янв 2025, 22:32 » в форуме Javascript

У меня есть 30 фотографий людей и 30 предложений, описывающих действия. Мне нужно создать рандомизированные пары, где фотография отображается с предложением под ней, а участники будут оценивать изображенного человека по шкале Лайкерта. Участники...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
24 янв 2025, 22:32
Как отправить вложения локального файла в Expo уведомления iOS вложения?

Последнее сообщение Anonymous « 28 апр 2025, 20:12
Добавлено в форуме IOS

Anonymous » 28 апр 2025, 20:12 » в форуме IOS

Аналогично UnnotificationAttachment, не подходящему для прикрепления изображения, но Expo. Так что я сделал. const = useAssets(localAttachments ?? []);
const = useState([]);

useEffect(() => {
let mounted = true;
(async () => {
if (!localAssets) {...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
28 апр 2025, 20:12
Разные подписи при подписании одних и тех же данных с использованием одного и того же закрытого ключа в Pkcs11Interop и

Последнее сообщение Anonymous « 01 июн 2024, 00:18
Добавлено в форуме C#

Anonymous » 01 июн 2024, 00:18 » в форуме C#

Я хочу использовать аппаратный модуль безопасности (HSM) для подписи строки. В частности, я использую для этого ePass3003Auto. Я сохранил сертификат в HSM, у которого есть закрытый ключ. Используя пакет Pkcs11Interop и механизм...

0 Ответы

128 Просмотры

Последнее сообщение Anonymous
01 июн 2024, 00:18

Вернуться в «Python»