Матрица расстояний Python Pandas с использованием подобия ЖаккараPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Матрица расстояний Python Pandas с использованием подобия Жаккара

Сообщение Anonymous »

Я реализовал функцию для построения матрицы расстояний, используя подобие Жаккара:

Код: Выделить всё

import pandas as pd
entries = [
{'id':'1', 'category1':'100', 'category2': '0', 'category3':'100'},
{'id':'2', 'category1':'100', 'category2': '0', 'category3':'100'},
{'id':'3', 'category1':'0', 'category2': '100', 'category3':'100'},
{'id':'4', 'category1':'100', 'category2': '100', 'category3':'100'},
{'id':'5', 'category1':'100', 'category2': '0', 'category3':'100'}
]
df = pd.DataFrame(entries)
и матрица расстояний с помощью scipy

Код: Выделить всё

from scipy.spatial.distance import squareform
from scipy.spatial.distance import pdist, jaccard

res = pdist(df[['category1','category2','category3']], 'jaccard')
squareform(res)
distance = pd.DataFrame(squareform(res), index=df.index, columns= df.index)
Проблема в том, что мой результат выглядит так, что кажется ложным:

Изображение


Что мне не хватает? Например, сходство 0 и 1 должно быть максимальным, и другие значения тоже кажутся неверными

Подробнее здесь: https://stackoverflow.com/questions/356 ... similarity
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»