У меня есть фрейм данных с 1000 текстовыми строками.
Я сделал word2vec.
Теперь я хочу создать новое поле, которое даст мне расстояние от каждого предложения до слова, которое я хочу, скажем, слова «король».
Я подумал о том, чтобы взять в каждом предложении 4 близких слова к слову «король» и вычислить из них среднее значение.
возможно, используя model.wv.similarity.
Среднее значение каждого предложения будет указано в поле df['king']
Я буду рад узнать, как это сделать или узнать о другом методе.
пример данных:
data = {
'text': [
"The king sat on the throne with wisdom.",
"A queen ruled the kingdom alongside the king.",
"Knights were loyal to their king.",
"The empire prospered under the rule of a wise monarch."
]
}
df = pd.DataFrame(data)
df['text']=df['text'].str.split()
model = Word2Vec(df['text'], vector_size=100, window=2, min_count=1 )
model.wv.similarity('Knights','king')
Подробнее здесь: https://stackoverflow.com/questions/792 ... g-word2vec
Сходство от слова к предложению после выполнения word2vec ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение