Сделайте Pyfftw быстрее, чем Scipy Convolve

Сделайте Pyfftw быстрее, чем Scipy Convolve ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Сделайте Pyfftw быстрее, чем Scipy Convolve

Цитата

Сообщение Anonymous » 08 фев 2025, 00:47

У меня есть простая функция, которая выполняет продукт скользящей точки, используя подход свертывания перекрытия: < /p>

Код: Выделить всё

import numpy as np
from scipy.signal import oaconvolve
import pyfftw
import os

def scipy_sliding_dot(A, B):
m = A.shape[0]
n = B.shape[0]
Ar = np.flipud(A)  # Reverse/flip A
AB = oaconvolve(Ar, B)

return AB.real[m - 1 : n]
< /code>
Для справки, это то же самое, что и делать: < /p>
def naive_sliding_dot(A, B):
m = len(A)
n = len(B)
l = n - m + 1
out = np.empty(l)
for i in range(l):
out[i] = np.dot(A, B[i:i+m])
return out
< /code>
Когда я инициализации двух случайных (всегда реальных, никогда не сложных) массивов: < /p>
A = np.random.rand(2**6)
B = np.random.rand(2**20)

, а затем Time scipy_sliding_dot с:

Код: Выделить всё

%timeit scipy_sliding_dot(A, B)
< /code>
Я получаю: < /p>
6.39 ms ± 38.2 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)

Я затем пытаюсь ускорить это с помощью многопоточного pyfftw :

Код: Выделить всё

class pyfftw_sliding_dot(object):
# Based on https://stackoverflow.com/a/30615425/2955541
def __init__(self, A, B, threads=1):
shape = (np.array(A.shape) + np.array(B.shape))-1
self.rfft_A_obj = pyfftw.builders.rfft(A, n=shape, threads=threads)
self.rfft_B_obj = pyfftw.builders.rfft(B, n=shape, threads=threads)
self.irfft_obj = pyfftw.builders.irfft(self.rfft_A_obj.output_array, n=shape, threads=threads)

def __call__(self, A, B):
m = A.shape[0]
n = B.shape[0]
Ar = np.flipud(A)  # Reverse/flip A
rfft_padded_A = self.rfft_A_obj(Ar)
rfft_padded_B = self.rfft_B_obj(B)

return self.irfft_obj(np.multiply(rfft_padded_A, rfft_padded_B)).real[m - 1 : n]
< /code>
Тогда я проверяю производительность с помощью: < /p>
n_threads = os.cpu_count()
obj = pyfftw_sliding_dot(A, B, n_threads)
%timeit obj(A, B)
< /code>
и get: < /p>
33 ms ± 347 μs per loop (mean ± std. dev. of 7 runs, 10 loops each)

Это означает, что многопоточный pyfftw ~ 5x медленнее, чем scipy . Я проложил документацию «Строители» и разыгрывал со всеми «дополнительными аргументами» (например, Planner_effort , Toverwrite_input и т. Д.), Но производительность pyfftw не меняется.
Что я делаю не так с pyfftw и как я могу сделать его быстрее, чем scipy ?

Подробнее здесь: https://stackoverflow.com/questions/794 ... y-convolve

1738964869

Anonymous

 У меня есть простая функция, которая выполняет продукт скользящей точки, используя подход свертывания перекрытия: < /p>
[code]import numpy as np
from scipy.signal import oaconvolve
import pyfftw
import os

def scipy_sliding_dot(A, B):
m = A.shape[0]
n = B.shape[0]
Ar = np.flipud(A)  # Reverse/flip A
AB = oaconvolve(Ar, B)

return AB.real[m - 1 : n]
< /code>
Для справки, это то же самое, что и делать: < /p>
def naive_sliding_dot(A, B):
m = len(A)
n = len(B)
l = n - m + 1
out = np.empty(l)
for i in range(l):
out[i] = np.dot(A, B[i:i+m])
return out
< /code>
Когда я инициализации двух случайных (всегда реальных, никогда не сложных) массивов: < /p>
A = np.random.rand(2**6)
B = np.random.rand(2**20)
[/code]
, а затем Time scipy_sliding_dot  с: 
[code]%timeit scipy_sliding_dot(A, B)
< /code>
Я получаю: < /p>
6.39 ms ± 38.2 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)

[/code]
Я затем пытаюсь ускорить это с помощью многопоточного pyfftw : 
[code]class pyfftw_sliding_dot(object):
# Based on https://stackoverflow.com/a/30615425/2955541
def __init__(self, A, B, threads=1):
shape = (np.array(A.shape) + np.array(B.shape))-1
self.rfft_A_obj = pyfftw.builders.rfft(A, n=shape, threads=threads)
self.rfft_B_obj = pyfftw.builders.rfft(B, n=shape, threads=threads)
self.irfft_obj = pyfftw.builders.irfft(self.rfft_A_obj.output_array, n=shape, threads=threads)

def __call__(self, A, B):
m = A.shape[0]
n = B.shape[0]
Ar = np.flipud(A)  # Reverse/flip A
rfft_padded_A = self.rfft_A_obj(Ar)
rfft_padded_B = self.rfft_B_obj(B)

return self.irfft_obj(np.multiply(rfft_padded_A, rfft_padded_B)).real[m - 1 : n]
< /code>
Тогда я проверяю производительность с помощью: < /p>
n_threads = os.cpu_count()
obj = pyfftw_sliding_dot(A, B, n_threads)
%timeit obj(A, B)
< /code>
и get: < /p>
33 ms ± 347 μs per loop (mean ± std. dev. of 7 runs, 10 loops each)
[/code]
Это означает, что многопоточный pyfftw  ~ 5x медленнее, чем scipy . Я проложил документацию «Строители» и разыгрывал со всеми «дополнительными аргументами» (например, Planner_effort , Toverwrite_input  и т. Д.), Но производительность pyfftw  не меняется. 
Что я делаю не так с pyfftw  и как я могу сделать его быстрее, чем scipy ?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79422227/make-pyfftw-faster-than-scipy-convolve[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Расхождение между C ++ FFTW и Pyfftw

Последнее сообщение Anonymous « 02 май 2025, 18:06
Добавлено в форуме Python

Anonymous » 02 май 2025, 18:06 » в форуме Python

Я использую библиотеку FFTW в C ++, и теперь мне нужно использовать ее в Python. Общий подход к этому, по -видимому, - библиотека PYFFTW.
Я обнаружил разницу между выходами очень основных программ с использованием библиотеки FFTW в C ++ и...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
02 май 2025, 18:06
Расхождение между C ++ FFTW и Pyfftw

Последнее сообщение Anonymous « 02 май 2025, 18:06
Добавлено в форуме C++

Anonymous » 02 май 2025, 18:06 » в форуме C++

Я использую библиотеку FFTW в C ++, и теперь мне нужно использовать ее в Python. Общий подход к этому, по -видимому, - библиотека PYFFTW.
Я обнаружил разницу между выходами очень основных программ с использованием библиотеки FFTW в C ++ и...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
02 май 2025, 18:06
Fftshift или convolve из модуля NumPy некорректно работают

Последнее сообщение Anonymous « 27 сен 2024, 18:16
Добавлено в форуме Python

Anonymous » 27 сен 2024, 18:16 » в форуме Python

Я пытаюсь показать в Python эквивалентность умножения двух сигналов во временной области и их свертки в частотной области.
Благодаря Baddioes в этом посте, это было показано, что такую эквивалентность можно показать с помощью функции fftshift, но...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 18:16
Fftshift или convolve из модуля NumPy некорректно работают

Последнее сообщение Anonymous « 27 сен 2024, 19:32
Добавлено в форуме Python

Anonymous » 27 сен 2024, 19:32 » в форуме Python

Я пытаюсь показать в Python эквивалентность умножения двух сигналов во временной области и их свертки в частотной области.
Благодаря Baddioes в этом посте, это было показано, что такую эквивалентность можно показать с помощью функции fftshift, но...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
27 сен 2024, 19:32
Fftshift или convolve из модуля NumPy некорректно работают

Последнее сообщение Anonymous « 30 сен 2024, 14:59
Добавлено в форуме Python

Anonymous » 30 сен 2024, 14:59 » в форуме Python

Я пытаюсь показать в Python эквивалентность умножения двух сигналов во временной области и их свертки в частотной области.
Благодаря Baddioes в этом посте, это было показано, что такую эквивалентность можно показать с помощью функции fftshift, но...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
30 сен 2024, 14:59

Вернуться в «Python»