У меня есть набор данных с истекшим временем определенных событий, и я хотел бы узнать общее время, затраченное в каждом временном интервале, используя поляры.
Функция hist дает количество событий в каждой скобке выглядит следующим образом:
но я не знаю, как получить такой компактный инклюзивный формат. В нем отсутствуют нулевые сегменты, и по какой-то причине он отображается в виде списка в списке.
У меня есть набор данных с истекшим временем определенных событий, и я хотел бы узнать общее время, затраченное в каждом временном интервале, используя поляры. Функция hist дает количество событий в каждой скобке выглядит следующим образом: [code]>>> df = pl.DataFrame( ... { ... "nam": ["a", "a", "a", "b", "b", "b", "b"], ... "ela": [1, 1, 20, 3, 4, 10, 20], ... } ... ) >>> df.group_by("nam").agg( ... pl.col("ela").hist([ 1, 10,]) ... ) shape: (2, 2) ┌─────┬───────────┐ │ nam ┆ ela │ │ --- ┆ --- │ │ str ┆ list[u32] │ ╞═════╪═══════════╡ │ a ┆ [2, 0, 1] │ │ b ┆ [0, 3, 1] │ └─────┴───────────┘
[/code] Я бы хотел увидеть что-то вроде этого [code]shape: (2, 2) ┌─────┬─────────────┐ │ nam ┆ ela │ │ --- ┆ --- │ │ str ┆ list[u32] │ ╞═════╪═════════════╡ │ a ┆ [2, 0, 20] │ │ b ┆ [0, 17, 20] │ └─────┴─────────────┘ [/code] Я пробовал использовать вырезание и включение [code]>>> (df.with_columns(pl.col("ela").cut([ 1, 10,]).alias("bucket")) ... .group_by("nam", "bucket") ... .agg(ela=pl.sum("ela")) ... .group_by("nam") ... .agg(pl.sum("ela").alias("ela_sum"), pl.implode("bucket", "ela")) ... ) shape: (2, 4) ┌─────┬─────────┬──────────────────────────────┬─────────────────┐ │ nam ┆ ela_sum ┆ bucket ┆ ela │ │ --- ┆ --- ┆ --- ┆ --- │ │ str ┆ i64 ┆ list[list[cat]] ┆ list[list[i64]] │ ╞═════╪═════════╪══════════════════════════════╪═════════════════╡ │ b ┆ 37 ┆ [["(1, 10]", "(10, inf]"]] ┆ [[17, 20]] │ │ a ┆ 22 ┆ [["(-inf, 1]", "(10, inf]"]] ┆ [[2, 20]] │ └─────┴─────────┴──────────────────────────────┴─────────────────┘ [/code] но я не знаю, как получить такой компактный инклюзивный формат. В нем отсутствуют нулевые сегменты, и по какой-то причине он отображается в виде списка в списке.
У меня есть набор данных с истекшим временем определенных событий, и я хотел бы узнать общее время, затраченное в каждом временном интервале, используя поляры.
Функция hist дает количество событий в каждой скобке выглядит следующим образом:
>>> df...
У меня есть набор данных с истекшим временем определенных событий, и я хотел бы узнать общее время, затраченное в каждом временном интервале, используя поляры.
Функция hist дает количество событий в каждой скобке выглядит следующим образом:
>>> df...
У меня есть набор данных с истекшим временем определенных событий, и я хотел бы узнать общее время, затраченное в каждом временном интервале, используя поляры.
Функция hist дает количество событий в каждой скобке выглядит следующим образом:
>>> df...
У меня есть набор данных с истекшим временем определенных событий, и я хотел бы узнать общее время, затраченное в каждом временном интервале, используя поляры.
Функция hist дает количество событий в каждой скобке выглядит следующим образом:
>>> df...
У меня есть набор данных с истекшим временем определенных событий, и я хотел бы узнать общее время, затраченное в каждом временном интервале, используя поляры.
Функция hist дает количество событий в каждой скобке выглядит следующим образом:
>>> df...