Как выбрать первые N значений столбца, упорядоченных по ключам, в группирующей переменной в Pandas DataFrame

Как выбрать первые N значений столбца, упорядоченных по ключам, в группирующей переменной в Pandas DataFrame ⇐ Python

1 сообщение • Страница 1 из 1

Гость

Как выбрать первые N значений столбца, упорядоченных по ключам, в группирующей переменной в Pandas DataFrame

Сообщение Гость » 21 сен 2023, 22:57

У меня есть набор данных:

импортировать панд как pd данные = [ («А», «Х»), («А», «Х»), («А», «Й»), («А», «Я»), («Б», 1), («Б», 1), ('БИ 2), ('БИ 2), («Б», 3), («Б», 3), («С», «Л-7»), («С», «Л-9»), («С», «Л-9»), («Т», 2020), («Т», 2020), («Т», 2025) ] df = pd.DataFrame(data, columns=['ID', 'SEQ']) печать (дф) Я хочу создать идентификатор и SEQ группы ключей, чтобы выбрать первые две строки каждой отдельной SEQ в каждой группе идентификаторов

Например, идентификатор A имеет три разных ключа: «A X», «AY» и «A Z» в порядке набора данных: первые два ключа — «A X» и «AY», поэтому я должен выбрать первые две строки (если имеется) каждого из них

"A X", "A X", "A Y" почему? потому что «A Z» — это еще один ключ.

Я пробовал использовать функции groupby и head, но не смог найти способа добиться такого конкретного результата. Может ли кто-нибудь предложить решение или указать мне правильное направление?

(df .groupby(['ID','SEQ']) .head(2) ) но он перенастраивает исходный набор данных, и мне интересно, можете ли вы, ребята, помочь мне решить эту проблему с помощью изменения метода, поскольку это мой любимый стиль в пандах, заранее большое спасибо

Окончательный правильный результат

Гость

1 сообщение • Страница 1 из 1

Вернуться в «Python»