ID Type Size
0 123 Red 5
1 456 Blue 7
2 789 Yellow 12
3 789 Yellow 4
Я теперь хочу агрегировать по id и взять среднее значение для дубликатов. Тем не менее, я хочу вернуть только ту же строку для типа , а не объединить ее. Я попытался запечатлеть это, используя Agg :
df = pd.DataFrame({'ID' : [123, 456, 789, 789], 'Type' : ['Red', 'Blue', 'Yellow', 'Yellow'], 'Size' : [5, 7, 12, 4]})
def identity(x):
return x
special_columns = ['Type']
aggfuncs = {col: statistics.mean for col in df.columns}
aggfuncs.update({col:identity for col in special_columns})
df.groupby(['ID'], as_index=False).agg(aggfuncs)
< /code>
Однако это все еще превращается в массив повторной строки: < /p>
ID Type Size
0 123 Red 5
1 456 Blue 7
2 789 [Yellow, Yellow] 8
< /code>
конечный результат, который я хотел: < /p>
ID Type Size
0 123 Red 5
1 456 Blue 7
2 789 Yellow 8
У меня есть дата, которая выглядит как следующее: < /p> [code] ID Type Size 0 123 Red 5 1 456 Blue 7 2 789 Yellow 12 3 789 Yellow 4 [/code] Я теперь хочу агрегировать по id и взять среднее значение для дубликатов. Тем не менее, я хочу вернуть только ту же строку для типа , а не объединить ее. Я попытался запечатлеть это, используя Agg : [code]df = pd.DataFrame({'ID' : [123, 456, 789, 789], 'Type' : ['Red', 'Blue', 'Yellow', 'Yellow'], 'Size' : [5, 7, 12, 4]})
def identity(x): return x
special_columns = ['Type'] aggfuncs = {col: statistics.mean for col in df.columns} aggfuncs.update({col:identity for col in special_columns}) df.groupby(['ID'], as_index=False).agg(aggfuncs) < /code> Однако это все еще превращается в массив повторной строки: < /p> ID Type Size 0 123 Red 5 1 456 Blue 7 2 789 [Yellow, Yellow] 8 < /code> конечный результат, который я хотел: < /p> ID Type Size 0 123 Red 5 1 456 Blue 7 2 789 Yellow 8 [/code] Как это можно достичь?
У меня есть текстовый файл средних цен на газ за каждую неделю в год, и мне нужно обрабатывать данные, получив ежемесячные средние значения этих цен. Это упражнение требует, чтобы я поместил 52-недельные средние значения в массив и показал...
Данные, с которыми я работаю:
data (140631115432592), ndim: 2, size: 3947910, shape: (232230, 17)
VIN (1-10) object
County object
City object
State object
Postal Code float64
Model Year int64
Make object
Model object
Electric Vehicle Type object...
У меня есть большой фрейм данных. Я хочу преобразовать их в соответствующий тип dtype. Проблема в том, что в нескольких числовых столбцах есть строки. Я знаю про Convert_dtypes и to_numeric.
Проблема с Convert_dtypes заключается в том, что он не...
У меня есть набор данных, который я хочу Groupby, а затем добавляю несколько рассчитанных столбцов на основе условий из других столбцов. Я хочу, чтобы статус включал только «open» и «закрыто», и я хочу, чтобы состояние исключало «fl». />
Пока что у...
Я хочу сгруппировать свой фрейм данных по столбцу с суммой значений из других строк в настроенном представлении.
Мой фрейм данных:| Release | Pass | Fail | Total |
|:---------:|:----:|:----:|:-----:|
| release_a | 10 | 20 | 30 |
| release_a | 5 | 45...