Как применить линейную регрессию к каждому пикселю в большом многомерном массиве, содержащем NaN? - Цифровое Кемерово

Как применить линейную регрессию к каждому пикселю в большом многомерном массиве, содержащем NaN? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как применить линейную регрессию к каждому пикселю в большом многомерном массиве, содержащем NaN?

Цитата

Сообщение Anonymous » 09 апр 2024, 21:33

У меня есть одномерный массив значений независимых переменных (

Код: Выделить всё

x_array

), которые соответствуют временным шагам в трехмерном массиве пространственных данных с несколькими временными шагами (

Код: Выделить всё

y_array). Мои фактические данные намного больше: более 300 временных шагов и до 3000 * 3000 пикселей:

import numpy as np
from scipy.stats import linregress

# Independent variable: four time-steps of 1-dimensional data
x_array = np.array([0.5, 0.2, 0.4, 0.4])

# Dependent variable: four time-steps of 3x3 spatial data
y_array = np.array([[[-0.2,   -0.2,   -0.3],
[-0.3,   -0.2,   -0.3],
[-0.3,   -0.4,   -0.4]],

[[-0.2,   -0.2,   -0.4],
[-0.3,   np.nan, -0.3],
[-0.3,   -0.3,   -0.4]],

[[np.nan, np.nan, -0.3],
[-0.2,   -0.3,   -0.7],
[-0.3,   -0.3,   -0.3]],

[[-0.1,   -0.3,   np.nan],
[-0.2,   -0.3,   np.nan],
[-0.1,   np.nan, np.nan]]])

Я хочу вычислить попиксельную линейную регрессию и получить R-квадрат, P-значения, точки пересечения и наклоны для каждого пикселя xy в y_array code> со значениями для каждого временного шага в x_array в качестве моей независимой переменной.

Я могу изменить форму, чтобы получить данные в форме для ввода их в np.polyfit, который векторизуется быстро:

Код: Выделить всё

# Reshape so rows = number of time-steps and columns = pixels:
y_array_reshaped = y_array.reshape(len(y_array), -1)

# Do a first-degree polyfit
np.polyfit(x_array, y_array_reshaped, 1)

Однако при этом игнорируются пиксели, содержащие любые значения NaN (

Код: Выделить всё

np.polyfit

не поддерживает значения NaN) и не вычисляет необходимую мне статистику (R-квадрат, P-значения, точки пересечения и наклоны).

В ответе здесь используется scipy.stats import linregress, который рассчитывает необходимую мне статистику и предлагает избегать проблем с NaN, маскируя эти NaN значения. Однако этот пример предназначен для двух одномерных массивов, и я не могу понять, как применить аналогичный подход к маскированию в моем случае, когда каждый столбец в y_array_reform будет иметь другой набор значений NaN.< /p>

Мой вопрос: Как я могу вычислить статистику регрессии для каждого пикселя в большом многомерном массиве (300 x 3000 x 3000), содержащем множество NaN code> достаточно быстрым векторизованным способом?

Желаемый результат: Массив 3 x 3 значений статистики регрессии (например, R-квадрат ) для каждого пикселя в y_array, даже если этот пиксель содержит значения NaN в какой-то момент временного ряда

Подробнее здесь: https://stackoverflow.com/questions/521 ... onal-array

Реклама

1712687600

Anonymous

У меня есть одномерный массив значений независимых переменных ([code]x_array[/code]), которые соответствуют временным шагам в трехмерном массиве пространственных данных с несколькими временными шагами ([code]y_array). Мои фактические данные намного больше: более 300 временных шагов и до 3000 * 3000 пикселей:

import numpy as np
from scipy.stats import linregress

# Independent variable: four time-steps of 1-dimensional data
x_array = np.array([0.5, 0.2, 0.4, 0.4])

# Dependent variable: four time-steps of 3x3 spatial data
y_array = np.array([[[-0.2,   -0.2,   -0.3],
[-0.3,   -0.2,   -0.3],
[-0.3,   -0.4,   -0.4]],

[[-0.2,   -0.2,   -0.4],
[-0.3,   np.nan, -0.3],
[-0.3,   -0.3,   -0.4]],

[[np.nan, np.nan, -0.3],
[-0.2,   -0.3,   -0.7],
[-0.3,   -0.3,   -0.3]],

[[-0.1,   -0.3,   np.nan],
[-0.2,   -0.3,   np.nan],
[-0.1,   np.nan, np.nan]]])
[/code]

Я хочу вычислить попиксельную линейную регрессию и получить R-квадрат, P-значения, точки пересечения и наклоны для каждого пикселя xy в y_array code> со значениями для каждого временного шага в x_array в качестве моей независимой переменной. 

Я могу изменить форму, чтобы получить данные в форме для ввода их в np.polyfit, который векторизуется быстро:

[code]# Reshape so rows = number of time-steps and columns = pixels:
y_array_reshaped = y_array.reshape(len(y_array), -1)

# Do a first-degree polyfit
np.polyfit(x_array, y_array_reshaped, 1)
[/code]

Однако при этом игнорируются пиксели, содержащие любые значения NaN ([code]np.polyfit[/code] не поддерживает значения NaN) и не вычисляет необходимую мне статистику (R-квадрат, P-значения, точки пересечения и наклоны). 

В ответе здесь используется scipy.stats import linregress, который рассчитывает необходимую мне статистику и предлагает избегать проблем с NaN, маскируя эти NaN  значения. Однако этот пример предназначен для двух одномерных массивов, и я не могу понять, как применить аналогичный подход к маскированию в моем случае, когда каждый столбец в y_array_reform будет иметь другой набор значений NaN.< /p>

[b]Мой вопрос:[/b] Как я могу вычислить статистику регрессии для каждого пикселя в большом многомерном массиве (300 x 3000 x 3000), содержащем множество NaN code> достаточно быстрым векторизованным способом?

[b]Желаемый результат:[/b] Массив 3 x 3 значений статистики регрессии (например, R-квадрат ) для каждого пикселя в y_array, даже если этот пиксель содержит значения NaN в какой-то момент временного ряда 

Подробнее здесь: [url]https://stackoverflow.com/questions/52108417/how-to-apply-linear-regression-to-every-pixel-in-a-large-multi-dimensional-array[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как получить доступ к данным в многомерном массиве, содержащем объекты? [дублировать]

Последнее сообщение Anonymous « 02 фев 2025, 12:38
Добавлено в форуме Php

Anonymous » 02 фев 2025, 12:38 » в форуме Php

У меня есть массив массивов, в которых я нахожу затруднительные переводы с Foreach и получение доступа к данным. .
array(
=> Array
(
=> stdClass Object
(
=> stdClass Object
(
=> 87126387136
=> stdClass Object
(
=> 0
=> stdClass Object
(
=>...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
02 фев 2025, 12:38
Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию

Последнее сообщение Anonymous « 01 ноя 2024, 22:23
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 22:23 » в форуме Python

import numpy as np
import pandas as pd

pd.set_option('future.no_silent_downcasting', True)

class LinearRegression:
def __init__(self, x_train, y_train, epochs=20, alpha=0.01):
self.x_train = pd.DataFrame(x_train)
self.y_train =...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 22:23
Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию

Последнее сообщение Anonymous « 03 ноя 2024, 06:51
Добавлено в форуме Python

Anonymous » 03 ноя 2024, 06:51 » в форуме Python

import numpy as np
import pandas as pd

pd.set_option('future.no_silent_downcasting', True)

class LinearRegression:
def __init__(self, x_train, y_train, epochs=20, alpha=0.01):
self.x_train = pd.DataFrame(x_train)
self.y_train =...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
03 ноя 2024, 06:51
Чрезвычайно высокое среднеквадратическое отклонение при тестировании на линейную регрессию

Последнее сообщение Anonymous « 11 ноя 2024, 04:48
Добавлено в форуме Python

Anonymous » 11 ноя 2024, 04:48 » в форуме Python

import numpy as np
import pandas as pd

pd.set_option('future.no_silent_downcasting', True)

class LinearRegression:
def __init__(self, x_train, y_train, epochs=20, alpha=0.01):
self.x_train = pd.DataFrame(x_train)
self.y_train =...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
11 ноя 2024, 04:48
Как выполнить линейную регрессию в sklearn с помощью специальной функции потерь

Последнее сообщение Anonymous « 15 дек 2024, 03:50
Добавлено в форуме Python

Anonymous » 15 дек 2024, 03:50 » в форуме Python

Я использую линейную регрессию в sklearn
model = LinearRegression()
model.fit(x_poly, y_true)

Вместо использования стандартной функции потерь (я думаю, это MSE), чтобы соответствовать моей линейной регрессии. Я хотел бы определить метрику...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
15 дек 2024, 03:50

Вернуться в «Python»

Programmiererforum