После удаления выбросов с помощью метода IQR я визуализировал данные с помощью коробчатой ​​диаграммы, но выбросы все раPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 После удаления выбросов с помощью метода IQR я визуализировал данные с помощью коробчатой ​​диаграммы, но выбросы все ра

Сообщение Anonymous »

Столбец «MMR» в моем наборе данных содержит цены на автомобили, и я хочу выявить выбросы в этом столбце. Сначала я визуализировал данные с помощью коробчатой ​​диаграммы, которая показывает наличие выбросов.
Визуализация столбца MMR
Я использовал столбец IQR, я вычислил 25-й показатель. процентиль и 75-й процентиль, чтобы я мог вычислить верхний и нижний предел столбца и отфильтровать данные, чтобы отобразить строки, которые были идентифицированы как выбросы. шаги, показанные в коде ниже:

Код: Выделить всё

# Calculating Q1, Q3, and IQR
Q1 = np.percentile(df['mmr'],25)
Q3 = np.percentile(df['mmr'],75)
IQR = Q3- Q1

#defining outlier thresholds
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

# filtering to show rows that contain outliers
df[(df['mmr']< lower_bound) | (df['mmr'] > upper_bound)]

Затем я отфильтровал выбросы, оставив только значения в требуемом диапазоне, и визуализировал данные:

Код: Выделить всё

dfNoOutlier = df[(df['mmr'] > lower_bound) & (df['mmr'] < upper_bound)]
plt.boxplot(dfNoOutlier['mmr'])

Результат после удаления выбросов
Ящик показывает, что выбросы остались, как можно решить эту проблему?

Подробнее здесь: https://stackoverflow.com/questions/791 ... -a-boxplot
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»