Предпринятые шаги предприняты:
Пропавшие значения:
Median rows с> 6 Колумбными столбцами. Scew
Код: Выделить всё
Q1 = df['SDQ_SDQ_Conduct_Problems'].quantile(0.25)
Q3 = df['SDQ_SDQ_Conduct_Problems'].quantile(0.75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
df['SDQ_SDQ_Conduct_Problems'] = np.where(
(df['SDQ_SDQ_Conduct_Problems'] < lower_bound) |
(df['SDQ_SDQ_Conduct_Problems'] > upper_bound),
df['SDQ_SDQ_Conduct_Problems'].median(),
df['SDQ_SDQ_Conduct_Problems']
)
Подробнее здесь: https://stackoverflow.com/questions/796 ... -correlati