Мой фрейм данных:
import pandas as pd
df = pd.DataFrame(
{
'a': [-3, -1, -2, -5, 10, -3, -13, -3, -2, 1, 2, -100],
}
)
Ожидаемый результат:
a
0 -3
1 -1
2 -2
3 -5
Логика:
Я хочу вернуть наибольшую серию отрицательных чисел. И если существует более одной самой большой полосы, я хочу вернуть первую полосу. В df есть две отрицательные полосы размером 4, поэтому возвращается первая.
Это моя попытка, но всякий раз, когда я использую idxmax() в мой код, я хочу перепроверить его, потому что в некоторых сценариях иногда бывает сложно.
import numpy as np
df['sign'] = np.sign(df.a)
df['sign_streak'] = df.sign.ne(df.sign.shift(1)).cumsum()
m = df.sign.eq(-1)
group_sizes = df.groupby('sign_streak').size()
largest_group = group_sizes.idxmax()
largest_group_df = df[df['sign_streak'] == largest_group]
Подробнее здесь: https://stackoverflow.com/questions/788 ... f-negative
Как лучше всего вернуть группу с наибольшей полосой отрицательных чисел в столбце? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Возможна ли в Python лексикографическая сортировка с наибольшей длиной?
Anonymous » » в форуме Python - 0 Ответы
- 18 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Найдите ребенка с наибольшей ценностью продукта с помощью Java Stream API
Anonymous » » в форуме JAVA - 0 Ответы
- 19 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как получить метаданные, связанные с наибольшей пронумерованной временной меткой JSON?
Anonymous » » в форуме Php - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-