Как рассчитать встраивание слов и предложений с помощью GPT-2? - Цифровое Кемерово

Как рассчитать встраивание слов и предложений с помощью GPT-2? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как рассчитать встраивание слов и предложений с помощью GPT-2?

Цитата

Сообщение Anonymous » 03 янв 2024, 05:26

Я работаю над программой, которая вычисляет встраивание слов и предложений с использованием GPT-2, в частности, над классом GPT2Model. Для встраивания слов я извлекаю последнее скрытое состояние outputs[0] после пересылки input_ids, которое имеет форму размер пакета x длина последовательности , в класс GPT2Model. Что касается встраивания предложений, я извлекаю скрытое состояние слова в конце последовательности. Это код, который я пробовал:

из трансформеров импортировать GPT2Tokenizer, GPT2Model импортный фонарь токенизатор = GPT2Tokenizer.from_pretrained('gpt2') модель = GPT2Model.from_pretrained('gpt2') captions = ["пример подписи", "пример птицы", "желтая птица с красными крыльями", "привет", "очень хорошо"] encoded_captions = [tokenizer.encode(caption) для подписи в подписях] # Дополнить последовательности одинаковой длины нулями max_len = max(len(seq) для seq в encoded_captions) Padded_captions = [seq + [0] * (max_len - len(seq)) для последовательности в encoded_captions] # Преобразование в тензор PyTorch с размером пакета 5 input_ids = torch.tensor(padded_captions) выходные данные = модель (input_ids) word_embedding = выходные данные[0].contigious() предложение_вложение = слово_вложение[ :, -1, : ].contigious() Я не уверен, что мои расчеты по встраиванию слов и предложений верны. Может ли кто-нибудь помочь мне это подтвердить?

Реклама

1704248797

Anonymous


Я работаю над программой, которая вычисляет встраивание слов и предложений с использованием GPT-2, в частности, над классом GPT2Model. Для встраивания слов я извлекаю последнее скрытое состояние outputs[0] после пересылки input_ids, которое имеет форму размер пакета x длина последовательности , в класс GPT2Model. Что касается встраивания предложений, я извлекаю скрытое состояние слова в конце последовательности. Это код, который я пробовал:
 
из трансформеров импортировать GPT2Tokenizer, GPT2Model импортный фонарь токенизатор = GPT2Tokenizer.from_pretrained('gpt2') модель = GPT2Model.from_pretrained('gpt2') captions = ["пример подписи", "пример птицы", "желтая птица с красными крыльями", "привет", "очень хорошо"] encoded_captions = [tokenizer.encode(caption) для подписи в подписях] # Дополнить последовательности одинаковой длины нулями max_len = max(len(seq) для seq в encoded_captions) Padded_captions = [seq + [0] * (max_len - len(seq)) для последовательности в encoded_captions] # Преобразование в тензор PyTorch с размером пакета 5 input_ids = torch.tensor(padded_captions) выходные данные = модель (input_ids) word_embedding = выходные данные[0].contigious() предложение_вложение = слово_вложение[ :, -1, : ].contigious()  Я не уверен, что мои расчеты по встраиванию слов и предложений верны. Может ли кто-нибудь помочь мне это подтвердить?

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как получить больше предложений слов от Hunspell с помощью pyhunspell

Последнее сообщение Anonymous « 26 окт 2023, 04:32
Добавлено в форуме Python

Anonymous » 26 окт 2023, 04:32 » в форуме Python

Я использую hunspell с оболочкой pyhunspell. Я звоню:

hunspell.suggest( Йокк ) Но это возвращает только . Я видел, что «Йорк» есть в словаре, но не возвращается. Есть ли способ вернуть более двух предложений, увеличив порог расстояния или...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
26 окт 2023, 04:32
Как получить больше предложений слов от Hunspell с помощью pyhunspell

Последнее сообщение Anonymous « 30 июл 2024, 14:18
Добавлено в форуме Python

Anonymous » 30 июл 2024, 14:18 » в форуме Python

Я использую hunspell с оболочкой pyhunspell. Я звоню:
hunspell.suggest( Yokk )

Но это возвращает только . Я видел, что «Йорк» есть в словаре, но не возвращается. Есть ли способ вернуть более двух предложений, увеличив порог расстояния или...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
30 июл 2024, 14:18
Получите частоты слов из массива строковых предложений с помощью Java 8

Последнее сообщение Anonymous « 12 ноя 2024, 18:10
Добавлено в форуме JAVA

Anonymous » 12 ноя 2024, 18:10 » в форуме JAVA

Итак, у меня есть следующий массив в качестве входных данных
String[] input = new String[] {
This is a sample string ,
string , // additional spaces here cause issues while splitting
Another sample string ,
This is not a sample string
};...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
12 ноя 2024, 18:10
Как запросить примеры поиска предложений с помощью индексированных японских слов из wwwjdic server wwwjdic server/API?

Последнее сообщение Anonymous « 31 мар 2025, 03:12
Добавлено в форуме C#

Anonymous » 31 мар 2025, 03:12 » в форуме C#

Я пытаюсь использовать wwwjdic server wwwjdic server intry/api для запроса примеров предложений с помощью индексированных японских слов, но мои запросы продолжают получать 500 внутренних ошибок сервера.
Подробности API можно найти здесь:
Вот код,...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
31 мар 2025, 03:12
Сходство от слова к предложению после произнесения слов Встраивание

Последнее сообщение Anonymous « 13 дек 2024, 01:00
Добавлено в форуме Python

Anonymous » 13 дек 2024, 01:00 » в форуме Python

У меня есть фрейм данных с 1000 текстовыми строками.
Я сделал word2vec.
Теперь я хочу создать новое поле, которое даст мне расстояние от каждого предложения до слова, которое я хочу, скажем, слова «король».
Я подумал о том, чтобы взять в каждом...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
13 дек 2024, 01:00

Вернуться в «Python»

Programmiererforum