Как бороться с NaN в numpy - Цифровое Кемерово

Как бороться с NaN в numpy ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 14 ноя 2024, 08:46

У меня есть набор данных, в котором недостающие данные указаны как NaN. Я использую десятичную дробь для всех чисел.
Я пытаюсь определить, приемлема ли замена среднего значения для замены отсутствующих данных.
Мой План состоит в том, чтобы вычислить стандартные отклонения и диапазоны каждого столбца и посмотреть, достаточно ли малы стандартные отклонения, чтобы мы могли безопасно выполнить замену среднего значения. (Я использую стандартное отклонение/диапазон в качестве базовой статистики теста, но дайте мне знать, если есть лучший способ)
Мой код:

Код: Выделить всё

for g in range(0, len(array)):
analArray.append([np.std(dataArray[:,g]), np.ptp(dataArray[:,g]), np.std(dataArray[:,g]) / np.ptp(dataArray[:,g])])

чтобы получить стандартное отклонение, диапазон и соотношение между ними.
Однако я получаю ошибку

Код: Выделить всё

in 
print([np.std(dataArray[:,g]), np.ptp(dataArray[:,g]), np.std(dataArray[:,g]) / np.ptp(dataArray[:,g])])
^^^^^^^^^^^^^^^^^^^^^^
TypeError: unsupported operand type(s) for /: 'str' and 'int'

Что я делаю не так?

Подробнее здесь: https://stackoverflow.com/questions/791 ... n-in-numpy

1731563192

Anonymous

У меня есть набор данных, в котором недостающие данные указаны как NaN.  Я использую десятичную дробь для всех чисел.
Я пытаюсь определить, приемлема ли замена среднего значения для замены отсутствующих данных.
Мой План состоит в том, чтобы вычислить стандартные отклонения и диапазоны каждого столбца и посмотреть, достаточно ли малы стандартные отклонения, чтобы мы могли безопасно выполнить замену среднего значения.  (Я использую стандартное отклонение/диапазон в качестве базовой статистики теста, но дайте мне знать, если есть лучший способ)
Мой код:
[code]for g in range(0, len(array)):
analArray.append([np.std(dataArray[:,g]), np.ptp(dataArray[:,g]), np.std(dataArray[:,g]) / np.ptp(dataArray[:,g])])

[/code]
чтобы получить стандартное отклонение, диапазон и соотношение между ними.
Однако я получаю ошибку
[code]in 
print([np.std(dataArray[:,g]), np.ptp(dataArray[:,g]), np.std(dataArray[:,g]) / np.ptp(dataArray[:,g])])
^^^^^^^^^^^^^^^^^^^^^^
TypeError: unsupported operand type(s) for /: 'str' and 'int'
[/code]
Что я делаю не так? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79187526/how-to-deal-with-nan-in-numpy[/url]