Каковы причины различий в результатах вывода при использовании функции groupby в пакете Python pandas?Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Каковы причины различий в результатах вывода при использовании функции groupby в пакете Python pandas?

Сообщение Anonymous »

Привет, недавно я практиковал обработку данных с помощью Python pandas и столкнулся с проблемой, связанной с функцией groupby. Вот мой файл и код:

Код: Выделить всё

#my file
data = {
'species': ['a', 'b', 'c', 'd', 'e', 'rt', 'gh', 'ed', 'e', 'd', 'd', 'q', 'ws', 'f', 'fg', 'a', 'a', 'a', 'a', 'a'],
's1': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20],
's2': [9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9],
's3': [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21],
's4': [10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10]
}

df = pd.DataFrame(data)

#my code:
grouped_df1 = df.groupby(df.columns[0], as_index=False).sum()

grouped_df2 = df.groupby(df.iloc[:, 0], as_index=False).sum()
Я хочу понять, что и grouped_df1, и grouped_df2 группируются по данным в 0-м столбце, но при выводе grouped_df1 успешно объединяет строки с одинаковыми значениями в 0-м столбце в одну, что результат, который я хочу. Однако grouped_df2 вместо этого объединяет идентичные строки в 0-м столбце в одну длинную строку во время слияния, а не объединяет их в одну строку. Вот результаты:

Код: Выделить всё

print(grouped_df1)
species  s1  s2  s3  s4
0        a  91  54  97  60
1        b   2   9   3  10
2        c   3   9   4  10
3        d  25  27  28  30
4        e  14  18  16  20
5       ed   8   9   9  10
6        f  14   9  15  10
7       fg  15   9  16  10
8       gh   7   9   8  10
9        q  12   9  13  10
10      rt   6   9   7  10
11      ws  13   9  14  10

print(grouped_df2)
species  s1  s2  s3  s4
0   aaaaaa  91  54  97  60
1        b   2   9   3  10
2        c   3   9   4  10
3      ddd  25  27  28  30
4       ee  14  18  16  20
5       ed   8   9   9  10
6        f  14   9  15  10
7       fg  15   9  16  10
8       gh   7   9   8  10
9        q  12   9  13  10
10      rt   6   9   7  10
11      ws  13   9  14  10
Пока причина неизвестна. Буду очень признателен, если вы поможете ответить на этот вопрос.

Подробнее здесь: https://stackoverflow.com/questions/793 ... the-groupb
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Поиск различий и объединение различий у панд
    Anonymous » » в форуме Python
    0 Ответы
    36 Просмотры
    Последнее сообщение Anonymous
  • Pandas представляет терминаторы строк через to_csv без причины или причины
    Anonymous » » в форуме Python
    0 Ответы
    36 Просмотры
    Последнее сообщение Anonymous
  • Pandas представляет терминаторы строк через to_csv без причины или причины
    Anonymous » » в форуме Linux
    0 Ответы
    28 Просмотры
    Последнее сообщение Anonymous
  • Декомпиляция .NET – причины различий
    Anonymous » » в форуме C#
    0 Ответы
    13 Просмотры
    Последнее сообщение Anonymous
  • Каковы распространенные причины ошибок сегментации при использовании map в C++? [закрыто]
    Anonymous » » в форуме C++
    0 Ответы
    49 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»