Визуализация столбца MMR
Я использовал столбец IQR, я вычислил 25-й показатель. процентиль и 75-й процентиль, чтобы я мог вычислить верхний и нижний предел столбца и отфильтровать данные, чтобы отобразить строки, которые были идентифицированы как выбросы. шаги, показанные в коде ниже:
Код: Выделить всё
# Calculating Q1, Q3, and IQR
Q1 = np.percentile(df['mmr'],25)
Q3 = np.percentile(df['mmr'],75)
IQR = Q3- Q1
#defining outlier thresholds
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
# filtering to show rows that contain outliers
df[(df['mmr']< lower_bound) | (df['mmr'] > upper_bound)]
Код: Выделить всё
dfNoOutlier = df[(df['mmr'] > lower_bound) & (df['mmr'] < upper_bound)]
plt.boxplot(dfNoOutlier['mmr'])
Ящик показывает, что выбросы остались, как можно решить эту проблему?
Подробнее здесь: https://stackoverflow.com/questions/791 ... -a-boxplot