Возьмите элементы из каждой группы в Polars, где группы неравномерны.

Возьмите элементы из каждой группы в Polars, где группы неравномерны. ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Возьмите элементы из каждой группы в Polars, где группы неравномерны.

Цитата

Сообщение Anonymous » 01 окт 2024, 12:51

Как взять первые n элементов группы, где n > G и G = количество элементов в группе?
Например,

Код: Выделить всё

import polars as pl
df = pl.DataFrame(dict(x=[1,1,1,2,3,3,3], y=[1,2,3,4,5,6,7]))
df.group_by("x").agg(pl.all().gather([0, 2]))

Приведенный выше пример возвращает ошибку OutOfBoundsError: индексы сбора выходят за пределы .

Подробнее здесь: https://stackoverflow.com/questions/761 ... e-not-even

1727776269

Anonymous

Как взять первые n элементов группы, где n > G и G = количество элементов в группе?
Например,
[code]import polars as pl
df = pl.DataFrame(dict(x=[1,1,1,2,3,3,3], y=[1,2,3,4,5,6,7]))
df.group_by("x").agg(pl.all().gather([0, 2]))
[/code]
Приведенный выше пример возвращает ошибку OutOfBoundsError: индексы сбора выходят за пределы .
 

Подробнее здесь: [url]https://stackoverflow.com/questions/76157217/take-elements-from-each-group-in-polars-where-the-groups-are-not-even[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pandas Groupby Несколько столбцов, агрегируйте некоторые столбцы, добавьте столбец каждой группы каждой группы

Последнее сообщение Anonymous « 19 фев 2025, 12:51
Добавлено в форуме Python

Anonymous » 19 фев 2025, 12:51 » в форуме Python

Данные, с которыми я работаю:
data (140631115432592), ndim: 2, size: 3947910, shape: (232230, 17)
VIN (1-10) object
County object
City object
State object
Postal Code float64
Model Year int64
Make object
Model object
Electric Vehicle Type object...

0 Ответы

29 Просмотры

Последнее сообщение Anonymous
19 фев 2025, 12:51
Возьмите совокупную сумму каждой строки в полярах.

Последнее сообщение Anonymous « 18 сен 2024, 15:46
Добавлено в форуме Python

Anonymous » 18 сен 2024, 15:46 » в форуме Python

Например. если у меня есть
import polars as pl
df = pl.DataFrame({'a': , 'b': })

как мне найти совокупную сумму каждой строки?
Ожидаемый результат:
a b
0 1 5
1 2 7
2 3 9

Вот эквивалент в pandas:
>>> import pandas as pd
>>> pd.DataFrame({'a':...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 15:46
Как установить замаскированные значения внутри каждой группы в контексте group_by, используя py-polars

Последнее сообщение Anonymous « 16 сен 2024, 21:23
Добавлено в форуме Python

Anonymous » 16 сен 2024, 21:23 » в форуме Python

Обновление: установка маски в контексте group_by теперь работает должным образом.

Поскольку ранг работает не обрабатывает нулевые значения, я хочу написать функцию Rank, которая может обрабатывать нулевые значения.
import numpy as np
import polars...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 21:23
Образец из каждой группы в кадре данных Polars?

Последнее сообщение Anonymous « 19 сен 2024, 21:58
Добавлено в форуме Python

Anonymous » 19 сен 2024, 21:58 » в форуме Python

Я ищу функцию типа
df.group_by('column').agg(sample(10))

чтобы я мог взять около десяти случайно выбранных элементов из каждой группы.
Это специально для того, чтобы я мог читать в LazyFrame и работать с небольшой выборкой каждой группы, а не со...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 21:58
Polars: заполните недостающие месяцы для каждой группы.

Последнее сообщение Anonymous « 01 окт 2024, 00:21
Добавлено в форуме Python

Anonymous » 01 окт 2024, 00:21 » в форуме Python

Я хочу заполнить недостающие месяцы в фрейме данных для каждой группы на основе минимальной и максимальной даты в каждой группе.
Этот подход работает, но использует Polars.map_elements .
import polars as pl
import numpy as np
from datetime import...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
01 окт 2024, 00:21

Вернуться в «Python»