У меня есть большой фрейм данных Polars, который я хотел бы разделить на n фреймов данных, учитывая размер. Например, возьмите фрейм данных и разделите его на 2, 3 или 5 фреймов данных.
Есть несколько наблюдений, которые будут отображаться для каждого столбца, и вы хотели бы выбрать разделение на выбранное количество фреймов данных. Простой пример похож на следующий, где я разбиваю по определенному идентификатору, но хотел бы иметь аналогичное поведение, но больше похоже на разделение на 2 примерно равных кадра данных, поскольку полный пример имеет большое количество идентификаторов.
df = pl.DataFrame({'Identifier': [1234,1234, 2345,2345],
'DateColumn': ['2022-02-13','2022-02-14', '2022-02-13',
'2022-02-14']
})
df2 = df.with_columns(
pl.col('DateColumn').str.to_date()
)
# df
┌────────────┬────────────┐
│ Identifier ┆ DateColumn │
│ --- ┆ --- │
│ i64 ┆ str │
╞════════════╪════════════╡
│ 1234 ┆ 2022-02-13 │
│ 1234 ┆ 2022-02-14 │
│ 2345 ┆ 2022-02-13 │
│ 2345 ┆ 2022-02-14 │
└────────────┴────────────┘
df1 = df.filter(
pl.col('Identifier')==1234
)
df2 = df.filter(
pl.col('Identifier')==2345
)
# df1
┌────────────┬────────────┐
│ Identifier ┆ DateColumn │
│ --- ┆ --- │
│ i64 ┆ str │
╞════════════╪════════════╡
│ 1234 ┆ 2022-02-13 │
│ 1234 ┆ 2022-02-14 │
└────────────┴────────────┘
# df2
┌────────────┬────────────┐
│ Identifier ┆ DateColumn │
│ --- ┆ --- │
│ i64 ┆ str │
╞════════════╪════════════╡
│ 2345 ┆ 2022-02-13 │
│ 2345 ┆ 2022-02-14 │
└────────────┴────────────┘
Подробнее здесь: https://stackoverflow.com/questions/754 ... -in-polars
Разделить фрейм данных на n фреймов данных по значению столбца в полярах ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Разделить фрейм данных в соответствии с подсписками по значению обрезки
Anonymous » » в форуме Python - 0 Ответы
- 18 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Разделить фрейм данных в соответствии с подсписками по значению обрезки
Anonymous » » в форуме Python - 0 Ответы
- 13 Просмотры
-
Последнее сообщение Anonymous
-