Является ли мой подход к обработке выбросов и отсутствующих значений подходящим для анализа корреляции между симптомами Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Является ли мой подход к обработке выбросов и отсутствующих значений подходящим для анализа корреляции между симптомами

Сообщение Anonymous »

В настоящее время я имею дело с цифровым набором данных для анализа взаимосвязи между возрастом и симптомами СДВГ, например (экстернализация, поведение_проводители, ...). < /p>
Предпринятые шаги предприняты:
Пропавшие значения:
Median rows с> 6 Колумбными столбцами. Scew

Код: Выделить всё

Q1 = df['SDQ_SDQ_Conduct_Problems'].quantile(0.25)
Q3 = df['SDQ_SDQ_Conduct_Problems'].quantile(0.75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
df['SDQ_SDQ_Conduct_Problems'] = np.where(
(df['SDQ_SDQ_Conduct_Problems'] < lower_bound) |
(df['SDQ_SDQ_Conduct_Problems'] > upper_bound),
df['SDQ_SDQ_Conduct_Problems'].median(),
df['SDQ_SDQ_Conduct_Problems']
)
_ правильный ли мой подход, и у кого -нибудь есть какие -либо комментарии или предложения о том, как я могу улучшить код?

Подробнее здесь: https://stackoverflow.com/questions/796 ... -correlati
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»