Рассмотрим следующий простой фрейм данных, состоящий из двоичного столбца с именем status и других числовых столбцов, пригодных для агрегирования, называемых столбцами 1 и столбцами 2
> df
status column1 column2
0 1 10 5
1 0 20 4
2 0 30 3
3 1 40 2
4 0 50 1
5 0 60 5
6 0 70 4
7 1 80 3
8 1 90 2
9 1 100 1
10 0 110 5
Я хочу выполнить агрегирование числовых столбцов, создав группы из 1, за которыми следуют 0, и 0, за которыми следуют 1, в столбце статуса, тем самым создавая перекрытие< /strong> поведение. После группировки будут сформированы следующие группы (начиная с индекса 0): индексы 0–2, индексы 2 и 3, индексы 3–6, индексы 6–9 и индексы 9 и 10.
После этого числовые столбцы можно легко агрегировать по нашему усмотрению.
Например. если мы хотим выполнить суммирование по столбцу 1: суммы 5 групп будут равны 60, 70, 220, 340 и 210 соответственно.
Я пробовал бесчисленное количество вариантов df[ 'status'].diff().ne(x).cumsum() для разных значений x, но я не могу справиться с ситуацией, возникающей из-за необходимости перекрывающиеся группы.
Изменить:
Поскольку было неясно, какой результат я хочу, потому что я говорил об агрегировании в В общем, предположим, что меня интересует вычисление суммы и медианы соответственно для столбца1 и столбца2 по группам, сформированным в соответствии с описанной выше процедурой. Это ожидаемый результат.
column1 column2
0 60.0 4.0
1 70.0 2.5
2 220.0 3.0
3 340.0 2.5
4 210.0 3.0
Подробнее здесь: https://stackoverflow.com/questions/769 ... s-datafram
Как узнать перекрывающиеся группы последовательных 0 и 1 в кадре данных pandas? ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Замените перекрывающиеся интервалы непересекающимися интервалами в кадре данных.
Anonymous » » в форуме Python - 0 Ответы
- 9 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Замените перекрывающиеся интервалы непересекающимися интервалами в кадре данных.
Anonymous » » в форуме Python - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-