Функция для удаления выбросов в нескольких столбцах. Правила IQR pandas.Python

Программы на Python
Ответить
Anonymous
 Функция для удаления выбросов в нескольких столбцах. Правила IQR pandas.

Сообщение Anonymous »

Я работаю над этой базой данных по заболеваниям сердца, и мне нужно удалить выбросы (в числовых столбцах) на основе условия установки порога S, равного 1,5-кратному межквартильному размаху.
Если значение меньше Q1 -S или больше, чем Q3+S, то это выброс.
Числовые столбцы этой базы данных:

Код: Выделить всё

col_numeriche = ['age', 'trestbps', 'chol', 'restecg', 'thalach', 'oldpeak', 'ca']
Правило заключается в удалении строк, которые имеют хотя бы одно значение выброса в столбце.
Поэтому я создал это функция:

Код: Выделить всё

def remove_outliers(df, colnames):
for colname in colnames:
n = df[colname]
q1 = n.quantile(0.25)
q3 = n.quantile(0.75)
S = 1.5 * (q3 - q1)
lower_bound = q1 - S
upper_bound = q3 + S
df = df[(n >= lower_bound) & (n 

Подробнее здесь: [url]https://stackoverflow.com/questions/79305534/function-to-remove-outliers-in-multiple-columns-iqr-rule-pandas[/url]
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»