мне нужно рассчитать среднее сходство косинуса для большого количества пар матриц (приблизительно 80 000 пар). В настоящее время каждая пара занимает около 20 секунд, что слишком медленно для моих нужд. Я был бы очень признателен за любые советы или решения для ускорения этого расчета. < /P>
Пример кода, который я использовал сейчас: < /p>
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np
matrix_a = [[...]] # matrix_a.shape: (5310000, 1602200)
matrix_b = [[matrix_1],[matrix_2],...,[matrix_n]] #similar shape to matrix a
similarity = np.mean(cosine_similarity(matrix_b, matrix_a), axis=1)
Подробнее здесь: https://stackoverflow.com/questions/787 ... e-pairs-of
Как оптимизировать расчет среднего сходства косинуса для больших пар матриц? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Оптимизация иерархического сходства сходства адреса на большем данных о данных с DASK
Anonymous » » в форуме Python - 0 Ответы
- 5 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Использование пандов для расчета среднего декабрьского января-февраля среднего
Anonymous » » в форуме Python - 0 Ответы
- 5 Просмотры
-
Последнее сообщение Anonymous
-