Сохраняет ли добавление нулей к встраиванию слов, чтобы увеличить размерность, сохраняет их семантическое значение? - Цифровое Кемерово

Сохраняет ли добавление нулей к встраиванию слов, чтобы увеличить размерность, сохраняет их семантическое значение? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Сохраняет ли добавление нулей к встраиванию слов, чтобы увеличить размерность, сохраняет их семантическое значение?

Цитата

Сообщение Anonymous » 14 июл 2025, 03:25

I Проанализировано предварительно загруженные 300-размерные векторы в 768 размерных векторов с помощью простого hstack , дополнительно 468 нулей. Я сделал это так, чтобы это было совместимо с матрицами запроса, ключей и значений, которые я загрузил из Дистилберта, используя библиотеку Transformers . Ниже приведен мой код: < /p>

Код: Выделить всё

from transformers import DistilBertModel
import numpy as np

model = DistilBertModel.from_pretrained("distilbert-base-uncased")
layer_0 = model.transformer.layer[0]

W_q = layer_0.attention.q_lin.weight.detach().numpy()
W_k = layer_0.attention.k_lin.weight.detach().numpy()
W_v = layer_0.attention.v_lin.weight.detach().numpy()

zeros = np.zeros((len(input_matrix), 468))
expanded_matrix = np.hstack((input_matrix, zeros))

input_matrix - это Ndarray из всех слов, которые вводит мой пользователь. Это часть механизма самостоятельного прихода, который я написал, который будет создавать модифицированную матрицу, которую я подам в сеть подачи вперед, чтобы получить эмоциональный тон текста моего пользователя. Без заполнения мой input_matrix IS (num_words, 300). Так что умножая его (

Код: Выделить всё

) не удастся с 300! = 768 . Я знаю, что могу использовать токенизатор дистильберта, но крайне важно, чтобы я не делал. class = "lang-py prettyprint-override">Q = expanded_matrix @ W_q
K = expanded_matrix @ W_k
V = expanded_matrix @ W_v
< /code>
Я видел ожидаемые отношения между словами. Однако для слоя 0 все точечные продукты были отрицательными. Это указывает на что -то не так? Для остальных 5 слоев значения представляли собой смесь негативов, нулей и положительных результатов (которые я ожидал). < /P>
Любой вход ценится. Если вы знаете другой трансформатор с предварительно обученным Q, k, V матрирами, совместимыми с моим оригинальным (num_words, 300) вход, пожалуйста, дайте мне знать.

Подробнее здесь: https://stackoverflow.com/questions/796 ... ve-their-s

Реклама

1752452741

Anonymous

 I Проанализировано предварительно загруженные 300-размерные векторы в 768 размерных векторов с помощью простого hstack , дополнительно 468 нулей. Я сделал это так, чтобы это было совместимо с матрицами запроса, ключей и значений, которые я загрузил из Дистилберта, используя библиотеку Transformers . Ниже приведен мой код: < /p>
[code]from transformers import DistilBertModel
import numpy as np

model = DistilBertModel.from_pretrained("distilbert-base-uncased")
layer_0 = model.transformer.layer[0]

W_q = layer_0.attention.q_lin.weight.detach().numpy()
W_k = layer_0.attention.k_lin.weight.detach().numpy()
W_v = layer_0.attention.v_lin.weight.detach().numpy()

zeros = np.zeros((len(input_matrix), 468))
expanded_matrix = np.hstack((input_matrix, zeros))
[/code]
input_matrix  - это Ndarray из всех слов, которые вводит мой пользователь. Это часть механизма самостоятельного прихода, который я написал, который будет создавать модифицированную матрицу, которую я подам в сеть подачи вперед, чтобы получить эмоциональный тон текста моего пользователя. Без заполнения мой input_matrix  IS (num_words, 300). Так что умножая его ([code]@[/code]) не удастся с 300! = 768 . Я знаю, что могу использовать токенизатор дистильберта, но крайне важно, чтобы я не делал. class = "lang-py prettyprint-override">Q = expanded_matrix @ W_q
K = expanded_matrix @ W_k
V = expanded_matrix @ W_v
< /code>
Я видел ожидаемые отношения между словами. Однако для слоя 0 все точечные продукты были отрицательными. Это указывает на что -то не так? Для остальных 5 слоев значения представляли собой смесь негативов, нулей и положительных результатов (которые я ожидал). < /P>
Любой вход ценится. Если вы знаете другой трансформатор с предварительно обученным Q, k, V матрирами, совместимыми с моим оригинальным (num_words, 300) вход, пожалуйста, дайте мне знать. 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79699508/does-adding-zeros-to-word-embeddings-to-increase-dimensionality-preserve-their-s[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Сохраняет ли добавление нулей к встраиванию слов, чтобы увеличить размерность, сохраняет их семантическое значение? [зак

Последнее сообщение Anonymous « 15 июл 2025, 13:16
Добавлено в форуме Python

Anonymous » 15 июл 2025, 13:16 » в форуме Python

I Проанализировано предварительно загруженные 300-размерные векторы в 768 размерных векторов с помощью простого hstack , дополнительно 468 нулей. Я сделал это так, чтобы это было совместимо с матрицами запроса, ключей и значений, которые я загрузил...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
15 июл 2025, 13:16
Сохраняет ли добавление куча нулей в встраивание слов в семантическое значение?

Последнее сообщение Anonymous « 12 июл 2025, 22:08
Добавлено в форуме Python

Anonymous » 12 июл 2025, 22:08 » в форуме Python

I Проанализировали предварительно загруженные 300-размерные векторы в 768-размерные векторы, просто проведя дополнительные 468 нулей. Я сделал это так, чтобы это было совместимо с матрицами запроса, ключей и значений, которые я загрузил в...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
12 июл 2025, 22:08
Сохраняет ли добавление куча нулей в встраивание слов в семантическое значение?

Последнее сообщение Anonymous « 13 июл 2025, 08:28
Добавлено в форуме Python

Anonymous » 13 июл 2025, 08:28 » в форуме Python

I Проанализировали предварительно загруженные 300-размерные векторы в 768-размерные векторы, просто проведя дополнительные 468 нулей. Я сделал это так, чтобы это было совместимо с матрицами запроса, ключей и значений, которые я загрузил в...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
13 июл 2025, 08:28
Ansible/jinja, добавление значений ключей из одного списка слов в другой список слов, если одно значение ключа совпадает

Последнее сообщение Anonymous « 20 май 2024, 08:57
Добавлено в форуме Linux

Anonymous » 20 май 2024, 08:57 » в форуме Linux

Я пытаюсь получить значения ключей из одного списка диктовок и вставить их в словари в другом списке диктовок, если один из ключей соответствует, Джиндже это не нравится.
используя ansible -core 2.15.11 с коллекциями Community.general и posix на...

0 Ответы

78 Просмотры

Последнее сообщение Anonymous
20 май 2024, 08:57
Размерность векторного пространства и степень в полиномиальном ядре

Последнее сообщение Гость « 29 окт 2023, 10:05
Добавлено в форуме Python

Гость » 29 окт 2023, 10:05 » в форуме Python

Пусть полиномиальное ядро κpol(x,z) представлено в явном виде (xTz+c)^q, где q — степень. Пусть размерность явного пространства признаков равна 15. Вопрос: Какова степень полинома и размерность того векторного пространства, на котором определено...

0 Ответы

34 Просмотры

Последнее сообщение Гость
29 окт 2023, 10:05

Вернуться в «Python»

Programmiererforum