Как применить линейную регрессию к каждому пикселю в большом многомерном массиве, содержащем NaN? - Цифровое Кемерово

Как применить линейную регрессию к каждому пикселю в большом многомерном массиве, содержащем NaN? ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как применить линейную регрессию к каждому пикселю в большом многомерном массиве, содержащем NaN?

Сообщение Anonymous » 28 окт 2025, 07:19

У меня есть одномерный массив значений независимых переменных (

Код: Выделить всё

x_array

), которые соответствуют временным шагам в трехмерном массиве пространственных данных с несколькими временными шагами (

Код: Выделить всё

y_array). Мои фактические данные намного больше: более 300 временных шагов и до 3000 * 3000 пикселей:

import numpy as np
from scipy.stats import linregress

# Independent variable: four time-steps of 1-dimensional data
x_array = np.array([0.5, 0.2, 0.4, 0.4])

# Dependent variable: four time-steps of 3x3 spatial data
y_array = np.array([[[-0.2,   -0.2,   -0.3],
[-0.3,   -0.2,   -0.3],
[-0.3,   -0.4,   -0.4]],

[[-0.2,   -0.2,   -0.4],
[-0.3,   np.nan, -0.3],
[-0.3,   -0.3,   -0.4]],

[[np.nan, np.nan, -0.3],
[-0.2,   -0.3,   -0.7],
[-0.3,   -0.3,   -0.3]],

[[-0.1,   -0.3,   np.nan],
[-0.2,   -0.3,   np.nan],
[-0.1,   np.nan, np.nan]]])

Я хочу вычислить попиксельную линейную регрессию и получить R-квадрат, P-значения, точки пересечения и наклоны для каждого пикселя xy в y_array со значениями для каждого временного шага в x_array в качестве независимой переменной.

Я могу изменить форму, чтобы получить данные в форме для ввода их в np.polyfit, который векторизуется быстро:

Код: Выделить всё

# Reshape so rows = number of time-steps and columns = pixels:
y_array_reshaped = y_array.reshape(len(y_array), -1)

# Do a first-degree polyfit
np.polyfit(x_array, y_array_reshaped, 1)

Однако при этом игнорируются пиксели, содержащие любые значения NaN (

Код: Выделить всё

np.polyfit

не поддерживает значения NaN) и не вычисляет необходимую мне статистику (R-квадрат, P-значения, точки пересечения и наклоны).

В ответе здесь используется scipy.stats import linregress, который рассчитывает необходимую мне статистику и предлагает избегать проблем с NaN, маскируя эти значения NaN. Однако этот пример предназначен для двух одномерных массивов, и я не могу понять, как применить аналогичный подход к маскированию в моем случае, когда каждый столбец в y_array_reform будет иметь другой набор значений NaN.

Мой вопрос: Как я могу вычислить статистику регрессии для каждого пикселя в большом многомерном массиве (300 x 3000 x 3000) содержащий множество значений NaN достаточно быстрым векторизованным способом?

Желаемый результат: Массив значений статистики регрессии 3 x 3 (например, R-квадрат) для каждого пикселя в y_array, даже если этот пиксель содержит значения NaN в какой-то момент временного ряда

Подробнее здесь: https://stackoverflow.com/questions/521 ... onal-array

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Python»