Как я могу разгруппировать фрейм данных Polars в Python? - Цифровое Кемерово

Как я могу разгруппировать фрейм данных Polars в Python? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как я могу разгруппировать фрейм данных Polars в Python?

Цитата

Сообщение Anonymous » 03 ноя 2025, 00:12

У меня есть фрейм данных Polars, в котором есть определенный столбец с повторяющимися шаблонами. Я сгруппировал их по шаблонам и добавил новый столбец в этот сгруппированный фрейм данных. Но теперь мне нужно распаковать/разгруппировать этот фрейм данных. Как я могу сделать это в полярах?
Мой исходный фрейм данных выглядит следующим образом:

file
col1
col2

A
ячейка 1
ячейка 2

B
ячейка 3
ячейка 4

A
ячейка 5
ячейка 6

B
ячейка 7
ячейка 8

Я выполнил группировку, чтобы сгруппировать кадр данных по ФАЙЛУ, а затем добавил желаемый новый столбец, и я получил вывод ниже.

файл
col1
col2
папка

A
[ячейка 1, ячейка 5]
[ячейка 2, ячейка 6]
[файл1, файл2]

B
[ячейка 3, ячейка 7]
[ячейка 4, ячейка 8]
[file1, file2]

Теперь я хочу разгруппировать приведенный выше фрейм данных в исходный формат, включив при этом этот новый столбец. Как я могу это сделать? Мой фактический фрейм данных огромен и имеет много строк и столбцов, использование итераций неэффективно и довольно медленно. Есть ли какая-либо функция, которую можно применить ко всему кадру данных вместо перебора по столбцам?
Окончательный желаемый результат:

файл
заголовок 1
заголовок 2
папка

A
ячейка 1
ячейка 2
файл1

B
ячейка 3
ячейка 4
файл1

A
ячейка 5
ячейка 6
файл2

B
ячейка 7
ячейка 8
file2

Я сделал следующее:

Код: Выделить всё

dfg = df.groupby('FILE').agg(pl.all())             #to group them first time
newdf =  dfg.with_columns(pl.repeat([file1,file2,file3], dfg.height)    #adding desired column

Какими эффективными способами я могу получить желаемый результат? Обратите внимание, что мой фрейм данных довольно большой, поэтому использование итераций по столбцам занимает много времени.
PS — Обновлена опечатка в конечном формате таблицы. В столбце «Файл», поскольку записи повторяются через несколько строк, им следует присвоить новое имя «папки».

Подробнее здесь: https://stackoverflow.com/questions/769 ... -in-python

1762117921

Anonymous

У меня есть фрейм данных Polars, в котором есть определенный столбец с повторяющимися шаблонами. Я сгруппировал их по шаблонам и добавил новый столбец в этот сгруппированный фрейм данных. Но теперь мне нужно распаковать/разгруппировать этот фрейм данных. Как я могу сделать это в полярах?
Мой исходный фрейм данных выглядит следующим образом:




file
col1
col2




A
ячейка 1
ячейка 2


B
ячейка 3
ячейка 4


A
ячейка 5
ячейка 6


B
ячейка 7
ячейка 8




Я выполнил группировку, чтобы сгруппировать кадр данных по ФАЙЛУ, а затем добавил желаемый новый столбец, и я получил вывод ниже.




файл
col1
col2
папка




A
[ячейка 1, ячейка 5]
[ячейка 2, ячейка 6]
[файл1, файл2]


B
[ячейка 3, ячейка 7]
[ячейка 4, ячейка 8]
[file1, file2]




Теперь я хочу разгруппировать приведенный выше фрейм данных в исходный формат, включив при этом этот новый столбец. Как я могу это сделать? Мой фактический фрейм данных огромен и имеет много строк и столбцов, использование итераций неэффективно и довольно медленно. Есть ли какая-либо функция, которую можно применить ко всему кадру данных вместо перебора по столбцам?
Окончательный желаемый результат:




файл
заголовок 1
заголовок 2
папка




A
ячейка 1
ячейка 2
файл1


B
ячейка 3
ячейка 4
файл1


A
ячейка 5
ячейка 6
файл2


B
ячейка 7
ячейка 8
file2




Я сделал следующее:
[code]dfg = df.groupby('FILE').agg(pl.all())             #to group them first time
newdf =  dfg.with_columns(pl.repeat([file1,file2,file3], dfg.height)    #adding desired column
[/code]
Какими эффективными способами я могу получить желаемый результат? Обратите внимание, что мой фрейм данных довольно большой, поэтому использование итераций по столбцам занимает много времени.
PS — Обновлена опечатка в конечном формате таблицы. В столбце «Файл», поскольку записи повторяются через несколько строк, им следует присвоить новое имя «папки». 

Подробнее здесь: [url]https://stackoverflow.com/questions/76913197/how-can-i-ungroup-a-polars-dataframe-in-python[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»