Сходство от слова к предложению после произнесения слов Встраивание

Сходство от слова к предложению после произнесения слов Встраивание ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Сходство от слова к предложению после произнесения слов Встраивание

Цитата

Сообщение Anonymous » 13 дек 2024, 01:00

У меня есть фрейм данных с 1000 текстовыми строками.
Я сделал word2vec.
Теперь я хочу создать новое поле, которое даст мне расстояние от каждого предложения до слова, которое я хочу, скажем, слова «король».
Я подумал о том, чтобы взять в каждом предложении 4 близких слова к слову «король» и вычислить из них среднее значение.
возможно, используя model.wv.similarity.
среднее значение каждого предложения будет указано в поле df['king']
Я буду рад узнать, как это сделать или узнать о другом методе.
пример данных:

Код: Выделить всё

    data = {
'text': [
"The king sat on the throne with wisdom.",
"A queen ruled the kingdom alongside the king.",
"Knights were loyal to their king.",
"The empire prospered under the rule of a wise monarch."
]
}
df = pd.DataFrame(data)
df['text']=df['text'].str.split()

model = Word2Vec(df['text'], vector_size=100, window=2, min_count=1 )

model.wv.similarity('Knights','king')

edit:
Моя миссия:
У меня 1000 текстов строки (люди, которые на что-то жалуются)
Я хочу каталогизировать их по 4 словам.
Допустим, слово 1 — главное. Слово 2 — замок…
Я хочу знать о каждом предложении, какое слово из 4 слов больше всего представляет предложение.
Для этого я подумал о том, чтобы взять каждое слово из 4 слов и вычислить модель. wv.similarity для всех слов в df['text'].
После этого для каждого предложения возьмите 3 слова, которые имеют наивысший балл к слову король (и к слову замок и и т. д.) .
вычислите среднее значение трех наивысших баллов, и это будет значение df['king'] для предложения

Подробнее здесь: https://stackoverflow.com/questions/792 ... -embedding

1734040821

Anonymous

У меня есть фрейм данных с 1000 текстовыми строками.
Я сделал word2vec.
Теперь я хочу создать новое поле, которое даст мне расстояние от каждого предложения до слова, которое я хочу, скажем, слова «король».
Я подумал о том, чтобы взять в каждом предложении 4 близких слова к слову «король» и вычислить из них среднее значение.
возможно, используя model.wv.similarity.
среднее значение каждого предложения будет указано в поле df['king']
Я буду рад узнать, как это сделать или узнать о другом методе.
пример данных:
[code]    data = {
'text': [
"The king sat on the throne with wisdom.",
"A queen ruled the kingdom alongside the king.",
"Knights were loyal to their king.",
"The empire prospered under the rule of a wise monarch."
]
}
df = pd.DataFrame(data)
df['text']=df['text'].str.split()

model = Word2Vec(df['text'], vector_size=100, window=2, min_count=1 )

model.wv.similarity('Knights','king')
[/code]
[b]edit[/b]:
Моя миссия:
У меня 1000 текстов строки (люди, которые на что-то жалуются)
Я хочу каталогизировать их по 4 словам.
Допустим, слово 1 — главное. Слово 2 — замок…
Я хочу знать о каждом предложении, какое слово из 4 слов больше всего представляет предложение.
Для этого я подумал о том, чтобы взять каждое слово из 4 слов и вычислить модель. wv.similarity для всех слов в df['text'].
После этого для каждого предложения возьмите 3 слова, которые имеют наивысший балл к слову король (и к слову замок и и т. д.) .
вычислите среднее значение трех наивысших баллов, и это будет значение df['king'] для предложения 

Подробнее здесь: [url]https://stackoverflow.com/questions/79264247/similarity-from-word-to-sentence-after-doing-words-embedding[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Сходство от слова к предложению после выполнения word2vec

Последнее сообщение Anonymous « 09 дек 2024, 11:14
Добавлено в форуме Python

Anonymous » 09 дек 2024, 11:14 » в форуме Python

У меня есть фрейм данных с 1000 текстовыми строками.
Я сделал word2vec.
Теперь я хочу создать новое поле, которое даст мне расстояние от каждого предложения до слова, которое я хочу, скажем, слова «король».
Я подумал о том, чтобы взять в каждом...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 11:14
Сходство от слова к предложению после выполнения word2vec

Последнее сообщение Anonymous « 09 дек 2024, 11:54
Добавлено в форуме Python

Anonymous » 09 дек 2024, 11:54 » в форуме Python

У меня есть фрейм данных с 1000 текстовыми строками.
Я сделал word2vec.
Теперь я хочу создать новое поле, которое даст мне расстояние от каждого предложения до слова, которое я хочу, скажем, слова «король».
Я подумал о том, чтобы взять в каждом...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 11:54
Сходство от слова к предложению после выполнения word2vec

Последнее сообщение Anonymous « 09 дек 2024, 16:27
Добавлено в форуме Python

Anonymous » 09 дек 2024, 16:27 » в форуме Python

У меня есть фрейм данных с 1000 текстовыми строками.
Я сделал word2vec.
Теперь я хочу создать новое поле, которое даст мне расстояние от каждого предложения до слова, которое я хочу, скажем, слова «король».
Я подумал о том, чтобы взять в каждом...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 16:27
API OpenAI Embeddings: как получить встраивание и вычислить косинусное сходство?

Последнее сообщение Anonymous « 15 окт 2024, 17:08
Добавлено в форуме Python

Anonymous » 15 окт 2024, 17:08 » в форуме Python

У меня есть встраивание OpenAI, созданное на основе их API.
Я вижу примеры помещения этого вектора в Postgres или Sqlite и последующего выполнения к нему запроса.
Я ищу простой код на Python, где я могу использовать текстовую строку и посмотреть,...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 17:08
Как получить косинусное сходство слова, встраиваемого из модели BERT

Последнее сообщение Anonymous « 01 фев 2025, 11:10
Добавлено в форуме Python

Anonymous » 01 фев 2025, 11:10 » в форуме Python

мне было интересно в том, как получить сходство слова, встраиваемого в разные предложения из модели BERT (на самом деле это означает, что слова имеют разные значения в разных сценариях).
Например:

Подробнее здесь:

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
01 фев 2025, 11:10

Вернуться в «Python»