У меня есть DataFrame со столбцом вида и четырьмя произвольными столбцами данных. Я хочу сгруппировать их по видам и просуммировать четыре столбца данных для каждого из них. Я пытался сделать это двумя способами: один раз с помощью группировки по df.columns[0] и один раз с помощью группировки по df.iloc[:, 0].
Оба метода правильно суммируют данные в четырех крайних правых столбцах. Но по какой-то причине второй метод также суммирует названия видов, объединяя их в одну длинную повторяющуюся строку.
Вот результат первого метода, о чем я и говорю. Я ищу:
У меня есть DataFrame со столбцом вида и четырьмя произвольными столбцами данных. Я хочу сгруппировать их по видам и просуммировать четыре столбца данных для каждого из них. Я пытался сделать это двумя способами: один раз с помощью группировки по df.columns[0] и один раз с помощью группировки по df.iloc[:, 0]. [code]data = { 'species': ['a', 'b', 'c', 'd', 'e', 'rt', 'gh', 'ed', 'e', 'd', 'd', 'q', 'ws', 'f', 'fg', 'a', 'a', 'a', 'a', 'a'], 's1': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20], 's2': [9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9, 9], 's3': [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21], 's4': [10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10] } df = pd.DataFrame(data)
grouped_df1 = df.groupby(df.columns[0], as_index=False).sum() grouped_df2 = df.groupby(df.iloc[:, 0], as_index=False).sum() [/code] Оба метода правильно суммируют данные в четырех крайних правых столбцах. Но по какой-то причине второй метод также суммирует названия видов, объединяя их в одну длинную повторяющуюся строку. Вот результат первого метода, о чем я и говорю. Я ищу: [code]print(grouped_df1) species s1 s2 s3 s4 0 a 91 54 97 60 1 b 2 9 3 10 2 c 3 9 4 10 3 d 25 27 28 30 4 e 14 18 16 20 5 ed 8 9 9 10 6 f 14 9 15 10 7 fg 15 9 16 10 8 gh 7 9 8 10 9 q 12 9 13 10 10 rt 6 9 7 10 11 ws 13 9 14 10 [/code] А вот результат метода df.iloc, который неправильно суммирует данные о видах: [code]print(grouped_df2) species s1 s2 s3 s4 0 aaaaaa 91 54 97 60 1 b 2 9 3 10 2 c 3 9 4 10 3 ddd 25 27 28 30 4 ee 14 18 16 20 5 ed 8 9 9 10 6 f 14 9 15 10 7 fg 15 9 16 10 8 gh 7 9 8 10 9 q 12 9 13 10 10 rt 6 9 7 10 11 ws 13 9 14 10 [/code] Почему второй метод суммирует названия видов, а также числовые данные?
Я кодирую в Python и использую Sympy. Я специально использую суммирование. В своем имене я использую Next () в своей формуле, чтобы я мог каждый раз перейти к следующему значению переменной, но у меня возникают проблемы.
the Значение Next () В моем...
Я кодирую в Python и использую Sympy. Я специально использую суммирование. В своем имене я использую Next () в своей формуле, чтобы я мог каждый раз перейти к следующему значению переменной, но у меня возникают проблемы.
the Значение Next () В моем...
У меня есть данные, которые выглядят следующим образом
startDate endDate value sourceName
0 2024-06-03 22:26:00+02:00 2024-06-03 22:46:00+02:00 HKCategoryValueSleepAnalysisAsleepCore AppleWatch
6 2024-06-03 22:40:00+02:00 2024-06-04 07:48:00+02:00...