Я пытаюсь определить, приемлема ли замена среднего значения для замены отсутствующих данных.
Мой План состоит в том, чтобы вычислить стандартные отклонения и диапазоны каждого столбца и посмотреть, достаточно ли малы стандартные отклонения, чтобы мы могли безопасно выполнить замену среднего значения. (Я использую стандартное отклонение/диапазон в качестве базовой статистики теста, но дайте мне знать, если есть лучший способ)
Мой код:
Код: Выделить всё
for g in range(0, len(array)):
analArray.append([np.std(dataArray[:,g]), np.ptp(dataArray[:,g]), np.std(dataArray[:,g]) / np.ptp(dataArray[:,g])])
Однако я получаю ошибку
Код: Выделить всё
in
print([np.std(dataArray[:,g]), np.ptp(dataArray[:,g]), np.std(dataArray[:,g]) / np.ptp(dataArray[:,g])])
^^^^^^^^^^^^^^^^^^^^^^
TypeError: unsupported operand type(s) for /: 'str' and 'int'
Подробнее здесь: https://stackoverflow.com/questions/791 ... n-in-numpy
Мобильная версия