Вычисление спектральных норм эрмитовых матриц ~1m: `numpy.linalg.norm` выполняется слишком медленно.

Вычисление спектральных норм эрмитовых матриц ~1m: `numpy.linalg.norm` выполняется слишком медленно. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Вычисление спектральных норм эрмитовых матриц ~1m: `numpy.linalg.norm` выполняется слишком медленно.

Цитата

Сообщение Anonymous » 31 окт 2024, 00:00

Я хотел бы вычислить спектральные нормы эрмитовых матриц N 8x8, при этом N близок к 1E6. В качестве примера возьмем 1 миллион случайных комплексных матриц размером 8x8:

Код: Выделить всё

import numpy as np

array = np.random.rand(8,8,1e6)  + 1j*np.random.rand(8,8,1e6)

Сейчас использование numpy.linalg.norm занимает у меня почти 10 секунд:

Код: Выделить всё

np.linalg.norm(array, ord=2, axis=(0,1))

Я попробовал использовать приведенный ниже код Cython, но это дало лишь незначительное улучшение производительности:

Код: Выделить всё

import numpy as np
cimport numpy as np
cimport cython

np.import_array()

DTYPE = np.complex64

@cython.boundscheck(False)
@cython.wraparound(False)
def function(np.ndarray[np.complex64_t, ndim=3] Array):
assert Array.dtype == DTYPE
cdef int shape0 = Array.shape[2]
cdef np.ndarray[np.float32_t, ndim=1] normarray = np.zeros(shape0, dtype=np.float32)
normarray = np.linalg.norm(Array, ord=2, axis=(0, 1))
return normarray

Я также попробовал numba и некоторые другие функции scipy (например, scipy.linalg.svdvals) для вычисления сингулярных значений этих матриц. Все по-прежнему слишком медленно.

Нельзя ли сделать это быстрее? numpy уже оптимизирован до такой степени, что невозможно получить прирост скорости при использовании Cython или numba? Или мой код крайне неэффективен и я делаю что-то в корне неправильно?

Я заметил, что только два ядра моего процессора используются на 100% при выполнении вычислений. Имея это в виду, я рассмотрел предыдущие вопросы StackOverflow:

почему numpy.mean не является многопоточным?
Почему многопроцессорная обработка использует только одно ядро после импорта numpy?
многопоточный blas в Python /numpy (не помогло)

и несколько других, но, к сожалению, у меня до сих пор нет решения.

Я подумал о том, чтобы разделить массив на более мелкие фрагменты и обработать их параллельно (возможно, на графическом процессоре с использованием CUDA). Есть ли способ сделать это в numpy/Python? Я пока не знаю, где находится узкое место в моем коде, т. е. связано ли оно с процессором, с памятью или, возможно, с чем-то другим.

Подробнее здесь: https://stackoverflow.com/questions/336 ... -norm-is-t

1730322050

Anonymous

Я хотел бы вычислить спектральные нормы эрмитовых матриц N 8x8, при этом N близок к 1E6. В качестве примера возьмем 1 миллион случайных комплексных матриц размером 8x8:

[code]import numpy as np

array = np.random.rand(8,8,1e6)  + 1j*np.random.rand(8,8,1e6)
[/code]

Сейчас использование numpy.linalg.norm занимает у меня почти 10 секунд: 

[code]np.linalg.norm(array, ord=2, axis=(0,1))
[/code]

Я попробовал использовать приведенный ниже код Cython, но это дало лишь незначительное улучшение производительности: 

[code]import numpy as np
cimport numpy as np
cimport cython

np.import_array()

DTYPE = np.complex64

@cython.boundscheck(False)
@cython.wraparound(False)
def function(np.ndarray[np.complex64_t, ndim=3] Array):
assert Array.dtype == DTYPE
cdef int shape0 = Array.shape[2]
cdef np.ndarray[np.float32_t, ndim=1] normarray = np.zeros(shape0, dtype=np.float32)
normarray = np.linalg.norm(Array, ord=2, axis=(0, 1))
return normarray
[/code]

Я также попробовал numba и некоторые другие функции scipy (например, scipy.linalg.svdvals) для вычисления сингулярных значений этих матриц. Все по-прежнему слишком медленно.

Нельзя ли сделать это быстрее? numpy уже оптимизирован до такой степени, что невозможно получить прирост скорости при использовании Cython или numba? Или мой код крайне неэффективен и я делаю что-то в корне неправильно?

Я заметил, что только два ядра моего процессора используются на 100% при выполнении вычислений. Имея это в виду, я рассмотрел предыдущие вопросы StackOverflow: 

[list]
[*]почему numpy.mean не является многопоточным?
[*]Почему многопроцессорная обработка использует только одно ядро после импорта numpy?
[*]многопоточный blas в Python /numpy (не помогло)
[/list]

и несколько других, но, к сожалению, у меня до сих пор нет решения. 

Я подумал о том, чтобы разделить массив на более мелкие фрагменты и обработать их параллельно (возможно, на графическом процессоре с использованием CUDA). Есть ли способ сделать это в numpy/Python? Я пока не знаю, где находится узкое место в моем коде, т. е. связано ли оно с процессором, с памятью или, возможно, с чем-то другим. 

Подробнее здесь: [url]https://stackoverflow.com/questions/33600328/computing-the-spectral-norms-of-1m-hermitian-matrices-numpy-linalg-norm-is-t[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Одновременная диагонализация набора коммутирующих эрмитовых матриц размера 8*8

Последнее сообщение Гость « 23 сен 2023, 16:51
Добавлено в форуме Python

Гость » 23 сен 2023, 16:51 » в форуме Python

У меня есть четыре коммутирующих эрмитовых матрицы 8*8 A, B, C, D. Собственные значения равны +1 и -1, каждая с кратностью 4. Я хочу диагонализировать эти матрицы одновременно. Из-за 4-кратного вырождения каждого собственного значения это непросто....

0 Ответы

18 Просмотры

Последнее сообщение Гость
23 сен 2023, 16:51
Landtrendr на спектральных индексах GEE

Последнее сообщение Anonymous « 08 апр 2025, 18:42
Добавлено в форуме Javascript

Anonymous » 08 апр 2025, 18:42 » в форуме Javascript

Я работаю с алгоритмом Landtrendr в Gee. Я хочу использовать платтер временных рядов Pixel для моего собственного ImageCollection на основе Landsat 4-9. Когда я применяю Landtrendr, используя свою собственную функцию NDVI, результат выглядит...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
08 апр 2025, 18:42
Обработка одного и того же массива dask.array выполняется слишком медленно по сравнению с numpy.array.

Последнее сообщение Anonymous « 04 дек 2024, 14:57
Добавлено в форуме Python

Anonymous » 04 дек 2024, 14:57 » в форуме Python

import BWStest as bws
import numpy as np
from skimage.measure import label
import dask.array
from tqdm import tqdm
CalWin =
stack = []
thershold = 0.05
for i in range(5):
image = np.random.rand(3000, 4000)
dask_image = dask.array.from_array(image,...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 14:57
Работа с Rcpp::List матриц с плотными или разреженными типами матриц

Последнее сообщение Anonymous « 09 дек 2024, 02:31
Добавлено в форуме C++

Anonymous » 09 дек 2024, 02:31 » в форуме C++

Мне нужно выполнить вычисления для каждой записи матрицы в Rcpp::List. Список содержит произвольную комбинацию плотных и разреженных матриц. Этот список передается в C++ из R. Мой вопрос касается как подходов к реализации, так и эффективности. Моя...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 02:31
Геометрическая классификация поверхности от норм поверхности

Последнее сообщение Anonymous « 14 апр 2025, 18:03
Добавлено в форуме Python

Anonymous » 14 апр 2025, 18:03 » в форуме Python

Я пытаюсь выяснить, есть ли хороший способ выполнения классификации поверхности для геометрии, такой как форма ниже. Поскольку это триангулированная поверхность, у меня есть координаты всех вершин и связь, которая ограничивает лица. Исходя из этого,...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
14 апр 2025, 18:03

Вернуться в «Python»