Самоучащийся в Python, я пытаюсь улучшить, так что любая помощь очень приветствуется, спасибо, много!
Я хочу вычислить сходство Jaccard по столбцу моего Frame, соответствующего критериям в другом столбце.
DF выглядит так: < /p>
name bag number item quantity
sally 1 BANANA 3
sally 2 BREAD 1
franck 3 BANANA 2
franck 3 ORANGE 1
franck 3 BREAD 4
robert 4 ORANGE 3
jenny 5 BANANA 4
jenny 5 ORANGE 2
< /code>
с примерно 80 категориальными предметами, номер сумки (образец) является уникальным для одного покупателя, но они могут иметь более одного количества, а количества варьируются от 0 до 4.
Я хотел бы перевести через номер сумки, чтобы сравнить содержимое с сходством Jaccard или расстоянием пары сумки. If possible with the option of considering the quantity as a weight of comparison.
the ideal result would be a dataframe like that
Python Pandas Distance matrix using jaccard similarity
I feel that the solution is somewher between this > How to compute jaccard similarity from a pandas dataframe
and that How to apply a custom function to groups in a dask dataframe, using Несколько столбцов как ввод функции < /p>
Я думаю, что я должен повторить маску для настройки двух переменной функции jaccard. Но в каждом примере, который я вижу, предметы, которые нужно сравнить, находятся в разных столбцах.
Так что я как бы потерял, здесь ...
Спасибо за помощь!
Cheers < /p>
Подробнее здесь: https://stackoverflow.com/questions/646 ... -dataframe
Вычислить сходство Jaccard по DataFrame ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Сходство предложения с использованием коэффициента Jaccard в файле Excel
Anonymous » » в форуме Python - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-
-
-
API OpenAI Embeddings: как получить встраивание и вычислить косинусное сходство?
Anonymous » » в форуме Python - 0 Ответы
- 18 Просмотры
-
Последнее сообщение Anonymous
-
-
-
MMD (максимальное среднее расхождение) с использованием сходства Jaccard?
Anonymous » » в форуме Python - 0 Ответы
- 4 Просмотры
-
Последнее сообщение Anonymous
-
-
-
MMD (максимальное среднее расхождение) с использованием сходства Jaccard?
Anonymous » » в форуме Python - 0 Ответы
- 5 Просмотры
-
Последнее сообщение Anonymous
-