Как оптимизировать расчет среднего сходства косинуса для больших пар матриц? - Цифровое Кемерово

Как оптимизировать расчет среднего сходства косинуса для больших пар матриц? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как оптимизировать расчет среднего сходства косинуса для больших пар матриц?

Цитата

Сообщение Anonymous » 13 мар 2025, 12:04

мне нужно рассчитать среднее сходство косинуса для большого количества пар матриц (приблизительно 80 000 пар). В настоящее время каждая пара занимает около 20 секунд, что слишком медленно для моих нужд. Я был бы очень признателен за любые советы или решения для ускорения этого расчета. < /P>
Пример кода, который я использовал сейчас: < /p>
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

matrix_a = [[...]] # matrix_a.shape: (5310000, 1602200)

matrix_b = [[matrix_1],[matrix_2],...,[matrix_n]] #similar shape to matrix a

similarity = np.mean(cosine_similarity(matrix_b, matrix_a), axis=1)

Подробнее здесь: https://stackoverflow.com/questions/787 ... e-pairs-of

Реклама

1741856643

Anonymous

 мне нужно рассчитать среднее сходство косинуса для большого количества пар матриц (приблизительно 80 000 пар). В настоящее время каждая пара занимает около 20 секунд, что слишком медленно для моих нужд. Я был бы очень признателен за любые советы или решения для ускорения этого расчета. < /P>
Пример кода, который я использовал сейчас: < /p>
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

matrix_a = [[...]] # matrix_a.shape: (5310000, 1602200)

matrix_b = [[matrix_1],[matrix_2],...,[matrix_n]] #similar shape to matrix a

similarity = np.mean(cosine_similarity(matrix_b, matrix_a), axis=1)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78755057/how-to-optimize-the-calculation-of-average-cosine-similarity-for-large-pairs-of[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Оптимизация иерархического сходства сходства адреса на большем данных о данных с DASK

Последнее сообщение Anonymous « 01 июл 2025, 17:22
Добавлено в форуме Python

Anonymous » 01 июл 2025, 17:22 » в форуме Python

Я работаю с очень большим набором данных (десятки миллионов строк), который содержит комбинации адресов во многих странах. Каждая строка представляет собой пару адресов, и я уже проанализировал эти адреса, используя модель Deepparse, поэтому мой...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
01 июл 2025, 17:22
Расчет Bazel Digest расчет больших разреженных файлов медленно

Последнее сообщение Anonymous « 12 фев 2025, 13:05
Добавлено в форуме Linux

Anonymous » 12 фев 2025, 13:05 » в форуме Linux

Мы используем Bazel для создания изображений разделения и дисков. Индивидуальные разделы построены на нескольких этапах сборки и собираются в дисковое изображение в конце. Размер составляет 1-10% от их логического размера.

Например: размер 100 ГБ,...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
12 фев 2025, 13:05
Использование пандов для расчета среднего декабрьского января-февраля среднего

Последнее сообщение Anonymous « 02 авг 2025, 09:46
Добавлено в форуме Python

Anonymous » 02 авг 2025, 09:46 » в форуме Python

Я хочу использовать Pandas для расчета среднего значения в течение трех отдельных месяцев в наборе данных, в котором перечислены год, месяц и стоимость процентов в трех различных столбцах. Обычно я просто использовал бы это Pandas.loc и Isin () и...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
02 авг 2025, 09:46
Действителен ли этот тест? tinygrad невероятно быстр по сравнению с torch или numpy для умножения матриц (ЦП) среднего р

Последнее сообщение Anonymous « 21 окт 2024, 08:55
Добавлено в форуме Python

Anonymous » 21 окт 2024, 08:55 » в форуме Python

Я запустил следующий тестовый код на процессоре Google Collab с включенным большим объемом оперативной памяти. Пожалуйста, укажите на любые ошибки в методе тестирования (если таковые имеются), а также на то, почему с tinygrad наблюдается такой...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 08:55
Работа с Rcpp::List матриц с плотными или разреженными типами матриц

Последнее сообщение Anonymous « 09 дек 2024, 02:31
Добавлено в форуме C++

Anonymous » 09 дек 2024, 02:31 » в форуме C++

Мне нужно выполнить вычисления для каждой записи матрицы в Rcpp::List. Список содержит произвольную комбинацию плотных и разреженных матриц. Этот список передается в C++ из R. Мой вопрос касается как подходов к реализации, так и эффективности. Моя...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 02:31

Вернуться в «Python»

Programmiererforum