Вычислить сходство Jaccard по DataFramePython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Вычислить сходство Jaccard по DataFrame

Сообщение Anonymous »

Самоучащийся в Python, я пытаюсь улучшить, так что любая помощь очень приветствуется, спасибо, много!
Я хочу вычислить сходство Jaccard по столбцу моего Frame, соответствующего критериям в другом столбце.
DF выглядит так: < /p>
name bag number item quantity
sally 1 BANANA 3
sally 2 BREAD 1
franck 3 BANANA 2
franck 3 ORANGE 1
franck 3 BREAD 4
robert 4 ORANGE 3
jenny 5 BANANA 4
jenny 5 ORANGE 2
< /code>
с примерно 80 категориальными предметами, номер сумки (образец) является уникальным для одного покупателя, но они могут иметь более одного количества, а количества варьируются от 0 до 4.
Я хотел бы перевести через номер сумки, чтобы сравнить содержимое с сходством Jaccard или расстоянием пары сумки. If possible with the option of considering the quantity as a weight of comparison.
the ideal result would be a dataframe like that
Python Pandas Distance matrix using jaccard similarity
I feel that the solution is somewher between this > How to compute jaccard similarity from a pandas dataframe
and that How to apply a custom function to groups in a dask dataframe, using Несколько столбцов как ввод функции < /p>
Я думаю, что я должен повторить маску для настройки двух переменной функции jaccard. Но в каждом примере, который я вижу, предметы, которые нужно сравнить, находятся в разных столбцах.
Так что я как бы потерял, здесь ...
Спасибо за помощь!
Cheers < /p>

Подробнее здесь: https://stackoverflow.com/questions/646 ... -dataframe
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»