MMD (максимальное среднее расхождение) с использованием сходства Jaccard?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 MMD (максимальное среднее расхождение) с использованием сходства Jaccard?

Сообщение Anonymous »

В настоящее время я вычисляю максимальное среднее расхождение (MMD) между двумя двоичными (0/1) наборами данных с использованием сходства Jaccard. Код работает, но, поскольку я новичок в этой концепции, я бы очень признателен за любые отзывы о том, является ли это подходящим подходом. < /P>

Код: Выделить всё

import numpy as np
from sklearn.metrics.pairwise import pairwise_distances

# Jaccard Kernel function
def jaccard_kernel(X, Y=None):
# self kernel
if Y is None:
Y = X

jaccard_distance = pairwise_distances(X, Y, metric='jaccard')
jaccard_similarity = 1- jaccard_distance
return jaccard_similarity

# MMD function
def compute_mmd_with_kernel(X, Y):
# Step 1: Compute the Jaccard kernel
similarity_matrix_X = jaccard_kernel(X)
similarity_matrix_XY = jaccard_kernel(X, Y)
similarity_matrix_Y = jaccard_kernel(Y)

# Step 2: Calculate MMD terms
m_X = len(X)
m_Y = len(Y)

# Calculate terms
term_X = np.sum(similarity_matrix_X) / (m_X * (m_X - 1))
term_XY = np.sum(similarity_matrix_XY) / (m_X * m_Y)
term_Y = np.sum(similarity_matrix_Y) / (m_Y * (m_Y - 1))

# Step 3: Compute MMD^2
mmd_squared = term_X - 2 * term_XY + term_Y

# Step 4: Compute final MMD
mmd = np.sqrt(mmd_squared)

return mmd
Ссылка: https://www.onurtunali.com/ml/2019/03/0 ... rning.html`

Подробнее здесь: https://stackoverflow.com/questions/796 ... similarity
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • MMD (максимальное среднее расхождение) с использованием сходства Jaccard?
    Anonymous » » в форуме Python
    0 Ответы
    4 Просмотры
    Последнее сообщение Anonymous
  • Оптимизация иерархического сходства сходства адреса на большем данных о данных с DASK
    Anonymous » » в форуме Python
    0 Ответы
    5 Просмотры
    Последнее сообщение Anonymous
  • Сходство предложения с использованием коэффициента Jaccard в файле Excel
    Anonymous » » в форуме Python
    0 Ответы
    2 Просмотры
    Последнее сообщение Anonymous
  • Как gcc -MMD записывает файлы .d?
    Anonymous » » в форуме C++
    0 Ответы
    7 Просмотры
    Последнее сообщение Anonymous
  • Вычислить сходство Jaccard по DataFrame
    Anonymous » » в форуме Python
    0 Ответы
    1 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»