В полярах, как подсчитывать уникальные строки в совокупности?Python

Программы на Python
Ответить
Anonymous
 В полярах, как подсчитывать уникальные строки в совокупности?

Сообщение Anonymous »

Мой формат:
data_string= """
A,B,C,D
0,0,0,0
0,0,0,1
0,0,1,1
1,0,0,0
1,0,0,0
1,0,0,0
1,1,0,0
1,1,0,0
1,1,0,1
1,1,1,0
"""
df = pl.read_csv(StringIO(data_string))

Мне нужно совокупное количество уникальных строк (столбец «фактическое» в конце). Я стараюсь:
df=(df
.with_columns(pl.lit(1).alias("ones"))
.select([
pl.all().exclude("ones"),
pl.col("ones").cum_count().over(['A', 'B', 'C', 'D']).flatten().alias("cum_count")
]))

Это близко, но не совсем (колонка «ожидается» в конце). Чего мне не хватает?
# expected actual
# 1 1
# 1 1
# 1 1
# 1 1
# 2 1
# 3 2
# 1 1
# 2 2
# 1 1
# 1 1


Подробнее здесь: https://stackoverflow.com/questions/780 ... mulatively
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»