Обработка одного и того же массива dask.array выполняется слишком медленно по сравнению с numpy.array.

Обработка одного и того же массива dask.array выполняется слишком медленно по сравнению с numpy.array. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Обработка одного и того же массива dask.array выполняется слишком медленно по сравнению с numpy.array.

Цитата

Сообщение Anonymous » 04 дек 2024, 14:57

import BWStest as bws
import numpy as np
from skimage.measure import label
import dask.array
from tqdm import tqdm
CalWin = [7,25]
stack = []
thershold = 0.05
for i in range(5):
image = np.random.rand(3000, 4000)
dask_image = dask.array.from_array(image, chunks=(1000, 1000))
stack.append(dask_image)
stacks = dask.array.stack(stack, axis=0)

npages,nlines,nwidths = np.shape(stacks)
RadiusRow=(CalWin[0] - 1) // 2
RadiusCol=(CalWin[1] -1 ) // 2
InitRow=(CalWin[0] + 1) // 2
InitCol=(CalWin[1] + 1) // 2
mlistack = dask.array.pad(dask.array.abs(stacks), ((0, 0), (RadiusRow, RadiusRow), (RadiusCol, RadiusCol)), mode='symmetric').compute()
meanmli = dask.array.mean(mlistack, axis=0)
nlines_EP,nwidths_EP = meanmli.shape
del meanmli
PixelInd = np.zeros((CalWin[0] * CalWin[1],nlines*nwidths), dtype=np.bool)
num = 0
compar_pixel = np.zeros((CalWin[0] * CalWin[1],nlines*nwidths))
for kk in tqdm(range(InitCol, nwidths_EP-RadiusCol), desc="Processing columns", ascii=' ='):
for ll in tqdm(range(InitRow, nlines_EP-RadiusRow), desc="Processing rows",
leave=False, ascii=' ='):
Matrix = mlistack[:,ll-RadiusRow-1:ll+RadiusRow,kk-RadiusCol-1:kk+RadiusCol]
# print(Matrix)
Ref = Matrix[:,InitRow-1,InitCol-1]
Xarray = np.tile(Ref[:, np.newaxis], (1, CalWin[0] * CalWin[1]))
Matrix_T = np.transpose(Matrix, (0, 2, 1))
Yarray = np.reshape(Matrix_T, (Matrix_T.shape[0], CalWin[0] * CalWin[1]))
T = bws.BWS(Xarray, Yarray, thershold)
SeedPoint = np.transpose(np.reshape(~T, (CalWin[1], CalWin[0])))
LL = label(SeedPoint, 2)
LL_flat = np.transpose(LL).flatten()
compar_pixel[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
PixelInd[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
num = num + 1

скорость обработки, наверное, 2400
dask-версия:

Код: Выделить всё

import BWStest as bws
import numpy as np
from skimage.measure import label
import dask.array
from tqdm import tqdm
from dask.distributed import Client, LocalCluster, progress
CalWin = [7,25]
stack = []
thershold = 0.05
for i in range(5):

image = np.random.rand(3000, 4000)
dask_image = dask.array.from_array(image, chunks=(1000, 1000))
stack.append(dask_image)
stacks = dask.array.stack(stack, axis=0)
npages,nlines,nwidths = np.shape(stacks)
RadiusRow=(CalWin[0] - 1) // 2
RadiusCol=(CalWin[1] -1 ) // 2
InitRow=(CalWin[0] + 1) // 2
InitCol=(CalWin[1] + 1) // 2
mlistack = dask.array.pad(dask.array.abs(stacks), ((0, 0), (RadiusRow, RadiusRow), (RadiusCol, RadiusCol)),mode='symmetric').compute()
meanmli = dask.array.mean(mlistack, axis=0)
nlines_EP,nwidths_EP = meanmli.shape
del meanmli

PixelInd = dask.array.zeros((CalWin[0] * CalWin[1],nlines*nwidths),
chunks=(CalWin[0] * CalWin[1],2048*nlines),dtype=np.bool)
num = 0
compar_pixel = dask.array.zeros((CalWin[0] * CalWin[1],nlines*nwidths),
chunks=(CalWin[0] * CalWin[1],2048*nlines),dtype=np.bool)
for kk in tqdm(range(InitCol, nwidths_EP-RadiusCol), desc="Processing columns",ascii=' ='):
for ll in tqdm(range(InitRow, nlines_EP-RadiusRow), desc="Processing rows",leave=False, ascii=' ='):
Matrix = mlistack[:,ll-RadiusRow-1:ll+RadiusRow,kk-RadiusCol-1:kk+RadiusCol]
Ref = Matrix[:,InitRow-1,InitCol-1]
Xarray = dask.array.tile(Ref[:, np.newaxis], (1, CalWin[0] * CalWin[1]))
Matrix_T = dask.array.transpose(Matrix, (0, 2, 1))
Yarray = dask.array.reshape(Matrix_T, (Matrix_T.shape[0], CalWin[0] *
CalWin[1]))
T = dask.array.from_array(bws.BWS(Xarray.compute(), Yarray.compute(), thershold))
SeedPoint = dask.array.transpose(dask.array.reshape(~T, (CalWin[1], CalWin[0])))
LL = dask.array.from_array(label(SeedPoint.compute(), 2))
LL_flat = dask.array.Array.flatten(dask.array.transpose(LL))
compar_pixel[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
PixelInd[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
num = num + 1

скорость обработки, вероятно, 40.
Из результатов видно, что обработка данных очень медленная.
Можете ли вы дать мне какое-то предложение, большое спасибо
это функция bws

Код: Выделить всё

import numpy as np
from scipy.stats import rankdata
def BWS(Xarrar, Yarray, threshold):
n, m = Xarrar.shape
rank = rankdata(np.vstack((Xarrar, Yarray)),  axis=0)
xrank = np.sort(rank[0:n,:], axis=0)
yrank = np.sort(rank[n::,:], axis=0)
temp = np.arange(1, n+1)[:,np.newaxis]*np.ones((1,m))
tempx = (xrank - 2.0*temp) ** 2
tempy = (yrank - 2.0*temp) ** 2
temp  = temp/(n+1) * (1-temp/(n+1)) * 2 * n
BX    = 1/n * np.sum(tempx / temp, axis=0)
BY    = 1/n * np.sum(tempy / temp, axis=0)
# test statistic
B = 1/2*(BX + BY)
if threshold ==0.05:
if n == 5:
b = 2.533
elif n == 6:
b = 2.552
elif n == 7:
b = 2.620
elif n == 8:
b = 2.564
elif n == 9:
b = 2.575
elif n == 10:
b = 2.583
else:
b = 2.493
else:
b = 3.880

H = (B >=b)
H = np.transpose(H)
return H

Поскольку в будущем мне придется иметь дело с очень большими матрицами, для хранения данных мне придется использовать dask. Однако, как новичок в dask, я хочу использовать dask для достижения той же скорости обработки, что и numpy

Подробнее здесь: https://stackoverflow.com/questions/792 ... umpy-array

1733313448

Anonymous

[code]import BWStest as bws
import numpy as np
from skimage.measure import label
import dask.array
from tqdm import tqdm
CalWin = [7,25]
stack = []
thershold = 0.05
for i in range(5):
image = np.random.rand(3000, 4000)
dask_image = dask.array.from_array(image, chunks=(1000, 1000))
stack.append(dask_image)
stacks = dask.array.stack(stack, axis=0)

npages,nlines,nwidths = np.shape(stacks)
RadiusRow=(CalWin[0] - 1) // 2
RadiusCol=(CalWin[1] -1 ) // 2
InitRow=(CalWin[0] + 1) // 2
InitCol=(CalWin[1] + 1) // 2
mlistack = dask.array.pad(dask.array.abs(stacks), ((0, 0), (RadiusRow, RadiusRow), (RadiusCol, RadiusCol)), mode='symmetric').compute()
meanmli = dask.array.mean(mlistack, axis=0)
nlines_EP,nwidths_EP = meanmli.shape
del meanmli
PixelInd = np.zeros((CalWin[0] * CalWin[1],nlines*nwidths), dtype=np.bool)
num = 0
compar_pixel = np.zeros((CalWin[0] * CalWin[1],nlines*nwidths))
for kk in tqdm(range(InitCol, nwidths_EP-RadiusCol), desc="Processing columns", ascii=' ='):
for ll in tqdm(range(InitRow, nlines_EP-RadiusRow), desc="Processing rows",
leave=False, ascii=' ='):
Matrix = mlistack[:,ll-RadiusRow-1:ll+RadiusRow,kk-RadiusCol-1:kk+RadiusCol]
# print(Matrix)
Ref = Matrix[:,InitRow-1,InitCol-1]
Xarray = np.tile(Ref[:, np.newaxis], (1, CalWin[0] * CalWin[1]))
Matrix_T = np.transpose(Matrix, (0, 2, 1))
Yarray = np.reshape(Matrix_T, (Matrix_T.shape[0], CalWin[0] * CalWin[1]))
T = bws.BWS(Xarray, Yarray, thershold)
SeedPoint = np.transpose(np.reshape(~T, (CalWin[1], CalWin[0])))
LL = label(SeedPoint, 2)
LL_flat = np.transpose(LL).flatten()
compar_pixel[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
PixelInd[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
num = num + 1
[/code]
скорость обработки, наверное, 2400
dask-версия:
[code]import BWStest as bws
import numpy as np
from skimage.measure import label
import dask.array
from tqdm import tqdm
from dask.distributed import Client, LocalCluster, progress
CalWin = [7,25]
stack = []
thershold = 0.05
for i in range(5):

image = np.random.rand(3000, 4000)
dask_image = dask.array.from_array(image, chunks=(1000, 1000))
stack.append(dask_image)
stacks = dask.array.stack(stack, axis=0)
npages,nlines,nwidths = np.shape(stacks)
RadiusRow=(CalWin[0] - 1) // 2
RadiusCol=(CalWin[1] -1 ) // 2
InitRow=(CalWin[0] + 1) // 2
InitCol=(CalWin[1] + 1) // 2
mlistack = dask.array.pad(dask.array.abs(stacks), ((0, 0), (RadiusRow, RadiusRow), (RadiusCol, RadiusCol)),mode='symmetric').compute()
meanmli = dask.array.mean(mlistack, axis=0)
nlines_EP,nwidths_EP = meanmli.shape
del meanmli

PixelInd = dask.array.zeros((CalWin[0] * CalWin[1],nlines*nwidths),
chunks=(CalWin[0] * CalWin[1],2048*nlines),dtype=np.bool)
num = 0
compar_pixel = dask.array.zeros((CalWin[0] * CalWin[1],nlines*nwidths),
chunks=(CalWin[0] * CalWin[1],2048*nlines),dtype=np.bool)
for kk in tqdm(range(InitCol, nwidths_EP-RadiusCol), desc="Processing columns",ascii=' ='):
for ll in tqdm(range(InitRow, nlines_EP-RadiusRow), desc="Processing rows",leave=False, ascii=' ='):
Matrix = mlistack[:,ll-RadiusRow-1:ll+RadiusRow,kk-RadiusCol-1:kk+RadiusCol]
Ref = Matrix[:,InitRow-1,InitCol-1]
Xarray = dask.array.tile(Ref[:, np.newaxis], (1, CalWin[0] * CalWin[1]))
Matrix_T = dask.array.transpose(Matrix, (0, 2, 1))
Yarray = dask.array.reshape(Matrix_T, (Matrix_T.shape[0], CalWin[0] *
CalWin[1]))
T = dask.array.from_array(bws.BWS(Xarray.compute(), Yarray.compute(), thershold))
SeedPoint = dask.array.transpose(dask.array.reshape(~T, (CalWin[1], CalWin[0])))
LL = dask.array.from_array(label(SeedPoint.compute(), 2))
LL_flat = dask.array.Array.flatten(dask.array.transpose(LL))
compar_pixel[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
PixelInd[:,num] = (LL_flat == LL[InitRow - 1, InitCol - 1])
num = num + 1
[/code]
скорость обработки, вероятно, 40.
Из результатов видно, что обработка данных очень медленная.
Можете ли вы дать мне какое-то предложение, большое спасибо
это функция bws
[code]import numpy as np
from scipy.stats import rankdata
def BWS(Xarrar, Yarray, threshold):
n, m = Xarrar.shape
rank = rankdata(np.vstack((Xarrar, Yarray)),  axis=0)
xrank = np.sort(rank[0:n,:], axis=0)
yrank = np.sort(rank[n::,:], axis=0)
temp = np.arange(1, n+1)[:,np.newaxis]*np.ones((1,m))
tempx = (xrank - 2.0*temp) ** 2
tempy = (yrank - 2.0*temp) ** 2
temp  = temp/(n+1) * (1-temp/(n+1)) * 2 * n
BX    = 1/n * np.sum(tempx / temp, axis=0)
BY    = 1/n * np.sum(tempy / temp, axis=0)
# test statistic
B = 1/2*(BX + BY)
if threshold ==0.05:
if n == 5:
b = 2.533
elif n == 6:
b = 2.552
elif n == 7:
b = 2.620
elif n == 8:
b = 2.564
elif n == 9:
b = 2.575
elif n == 10:
b = 2.583
else:
b = 2.493
else:
b = 3.880

H = (B >=b)
H = np.transpose(H)
return H
[/code]
Поскольку в будущем мне придется иметь дело с очень большими матрицами, для хранения данных мне придется использовать dask. Однако, как новичок в dask, я хочу использовать dask для достижения той же скорости обработки, что и numpy 

Подробнее здесь: [url]https://stackoverflow.com/questions/79251065/processing-the-same-array-dask-array-is-too-slow-compared-to-numpy-array[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему обработка отсортированного массива выполняется быстрее, чем обработка несортированного массива?

Последнее сообщение Anonymous « 17 окт 2024, 16:26
Добавлено в форуме JAVA

Anonymous » 17 окт 2024, 16:26 » в форуме JAVA

В этом коде C++ сортировка данных (до временной области) ускоряет основной цикл примерно в 6 раз:
#include
#include
#include

int main()
{
// Generate data
const unsigned arraySize = 32768;
int data ;

for (unsigned c = 0; c = 128)
sum += data...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 16:26
Почему обработка отсортированного массива выполняется быстрее, чем обработка несортированного массива?

Последнее сообщение Anonymous « 17 окт 2024, 17:30
Добавлено в форуме JAVA

Anonymous » 17 окт 2024, 17:30 » в форуме JAVA

В этом коде C++ сортировка данных (до временной области) ускоряет основной цикл примерно в 6 раз:
#include
#include
#include

int main()
{
// Generate data
const unsigned arraySize = 32768;
int data ;

for (unsigned c = 0; c = 128)
sum += data...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 17:30
Почему обработка отсортированного массива выполняется быстрее, чем обработка несортированного массива?

Последнее сообщение Anonymous « 14 ноя 2024, 12:31
Добавлено в форуме JAVA

Anonymous » 14 ноя 2024, 12:31 » в форуме JAVA

В этом коде C++ сортировка данных (до временной области) ускоряет основной цикл примерно в 6 раз:
#include
#include
#include

int main()
{
// Generate data
const unsigned arraySize = 32768;
int data ;

for (unsigned c = 0; c = 128)
sum += data...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
14 ноя 2024, 12:31
Почему обработка отсортированного массива выполняется быстрее, чем обработка несортированного массива?

Последнее сообщение Anonymous « 14 ноя 2024, 18:48
Добавлено в форуме JAVA

Anonymous » 14 ноя 2024, 18:48 » в форуме JAVA

В этом коде C++ сортировка данных (до временной области) ускоряет основной цикл примерно в 6 раз:
#include
#include
#include

int main()
{
// Generate data
const unsigned arraySize = 32768;
int data ;

for (unsigned c = 0; c = 128)
sum += data...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
14 ноя 2024, 18:48
Вычисление спектральных норм эрмитовых матриц ~1m: `numpy.linalg.norm` выполняется слишком медленно.

Последнее сообщение Anonymous « 31 окт 2024, 00:00
Добавлено в форуме Python

Anonymous » 31 окт 2024, 00:00 » в форуме Python

Я хотел бы вычислить спектральные нормы эрмитовых матриц N 8x8, при этом N близок к 1E6. В качестве примера возьмем 1 миллион случайных комплексных матриц размером 8x8:

import numpy as np

array = np.random.rand(8,8,1e6) +...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
31 окт 2024, 00:00

Вернуться в «Python»