Это мой фрейм данных:
import pandas as pd
df = pd.DataFrame({
'a': [10, 20, 30, 50, 50, 50, 4, 100],
'b': [30, 3, 200, 25, 24, 31, 29, 2],
'd': list('aaabbbcc')
})
Ожидаемый результат:
a b d
0 10 30 a
1 20 3 a
2 30 200 a
Группировка осуществляется по столбцу d. Я хочу вернуть группы, в которых есть хотя бы два экземпляра этой маски
m = (df.b.gt(df.a))
Это то, что я пробовал. Это работает, но мне интересно, есть ли лучший/более эффективный способ сделать это.
out = df.groupby('d').filter(lambda x: len(x.loc[x.b.gt(x.a)]) >= 2)
Подробнее здесь: https://stackoverflow.com/questions/791 ... at-meets-t
Как лучше всего отфильтровать группы, в которых есть хотя бы N строк, соответствующих условиям маски? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение