Python pandas не может использовать методmean() с grouby

Python pandas не может использовать методmean() с grouby ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Python pandas не может использовать методmean() с grouby

Цитата

Сообщение Anonymous » 28 окт 2024, 21:59

Сейчас я изучаю pandas и столкнулся с ошибкой. база данных, которую я использовал: https://github.com/KeithGalli/pandas/bl ... n_data.csv
Я пробовал, как указано в учебнике YouTube:

Код: Выделить всё

print(df.groupby(['Type 1']).mean())

но возвращает ошибку:

Код: Выделить всё

Traceback (most recent call last):
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1942, in _agg_py_fallback
res_values = self._grouper.agg_series(ser, alt, preserve_dtype=True)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\ops.py", line 864, in agg_series
result = self._aggregate_series_pure_python(obj, func)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\ops.py", line 885, in _aggregate_series_pure_python
res = func(group)
^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 2454, in 
alt=lambda x: Series(x, copy=False).mean(numeric_only=numeric_only),
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\series.py", line 6549, in mean
return NDFrame.mean(self, axis, skipna, numeric_only, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\generic.py", line 12420, in mean
return self._stat_function(
^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\generic.py", line 12377, in _stat_function
return self._reduce(
^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\series.py", line 6457, in _reduce
return op(delegate, skipna=skipna, **kwds)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 147, in f
result = alt(values, axis=axis, skipna=skipna, **kwds)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 404, in new_func
result = func(values, axis=axis, skipna=skipna, mask=mask, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 720, in nanmean
the_sum = _ensure_numeric(the_sum)
^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 1701, in _ensure_numeric
raise TypeError(f"Could not convert string '{x}' to numeric")
TypeError:  Could not convert string 'CaterpieMetapodButterfreeWeedleKakunaBeedrillBeedrillMega BeedrillParasParasectVenonatVenomothScytherPinsirPinsirMega PinsirLedybaLedianSpinarakAriadosYanmaPinecoForretressScizorScizorMega ScizorShuckleHeracrossHeracrossMega HeracrossWurmpleSilcoonBeautiflyCascoonDustoxSurskitMasquerainNincadaNinjaskShedinjaVolbeatIllumiseKricketotKricketuneBurmyWormadamPlant CloakWormadamSandy CloakWormadamTrash CloakMothimCombeeVespiquenYanmegaSewaddleSwadloonLeavannyVenipedeWhirlipedeScolipedeDwebbleCrustleKarrablastEscavalierJoltikGalvantulaShelmetAccelgorDurantLarvestaVolcaronaGenesectScatterbugSpewpaVivillon' to numeric

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "D:\PyCharm projects\pandastutorial\advanced.py", line 40, in 
print(df.groupby(['Type 1']).mean())
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 2452, in mean
result = self._cython_agg_general(
^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1998, in _cython_agg_general
new_mgr = data.grouped_reduce(array_func)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\internals\managers.py", line 1469, in grouped_reduce
applied = sb.apply(func)
^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\internals\blocks.py", line 393, in apply
result = func(self.values, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1995, in array_func
result = self._agg_py_fallback(how, values, ndim=data.ndim, alt=alt)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1946, in _agg_py_fallback
raise type(err)(msg) from err
TypeError: agg function failed [how->mean,dtype->object]

Поскольку это проблема со строковыми значениями (это сработало для парня из руководства), я попробовал это:

Код: Выделить всё

    print(df[['HP','Attack','Defense']].groupby(['Type 1']).mean())

но он вернул еще одну ошибку:

Код: Выделить всё

Traceback (most recent call last):
File "D:\PyCharm projects\pandastutorial\advanced.py", line 42, in 
print(df[['HP','Attack','Defense']].groupby(['Type 1']).mean())
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\frame.py", line 9183, in groupby
return DataFrameGroupBy(
^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1329, in __init__
grouper, exclusions, obj = get_grouper(
^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\grouper.py", line 1043, in get_grouper
raise KeyError(gpr)
KeyError: 'Type 1'

Сработало следующее:

Код: Выделить всё

    print(df.groupby(['Type 1']).agg({'Speed':'mean', 'Defense':'mean'}))

но мне нужно среднее значение всех числовых значений, и я не хочу указывать его индивидуально. Я знаю, что это может быть полезно, когда вы указываете среднее значение для одного столбца и, например, минимальное значение для другого, но это раздражает, а иногда и невозможно для огромных баз данных. Есть ли способ сделать это быстрее? С уважением

Подробнее здесь: https://stackoverflow.com/questions/791 ... ith-grouby

1730141953

Anonymous

Сейчас я изучаю pandas и столкнулся с ошибкой.  база данных, которую я использовал: https://github.com/KeithGalli/pandas/blob/master/pokemon_data.csv
Я пробовал, как указано в учебнике YouTube:
[code]print(df.groupby(['Type 1']).mean())
[/code]
но возвращает ошибку:
[code]Traceback (most recent call last):
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1942, in _agg_py_fallback
res_values = self._grouper.agg_series(ser, alt, preserve_dtype=True)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\ops.py", line 864, in agg_series
result = self._aggregate_series_pure_python(obj, func)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\ops.py", line 885, in _aggregate_series_pure_python
res = func(group)
^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 2454, in 
alt=lambda x: Series(x, copy=False).mean(numeric_only=numeric_only),
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\series.py", line 6549, in mean
return NDFrame.mean(self, axis, skipna, numeric_only, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\generic.py", line 12420, in mean
return self._stat_function(
^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\generic.py", line 12377, in _stat_function
return self._reduce(
^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\series.py", line 6457, in _reduce
return op(delegate, skipna=skipna, **kwds)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 147, in f
result = alt(values, axis=axis, skipna=skipna, **kwds)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 404, in new_func
result = func(values, axis=axis, skipna=skipna, mask=mask, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 720, in nanmean
the_sum = _ensure_numeric(the_sum)
^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\nanops.py", line 1701, in _ensure_numeric
raise TypeError(f"Could not convert string '{x}' to numeric")
TypeError:  Could not convert string 'CaterpieMetapodButterfreeWeedleKakunaBeedrillBeedrillMega BeedrillParasParasectVenonatVenomothScytherPinsirPinsirMega PinsirLedybaLedianSpinarakAriadosYanmaPinecoForretressScizorScizorMega ScizorShuckleHeracrossHeracrossMega HeracrossWurmpleSilcoonBeautiflyCascoonDustoxSurskitMasquerainNincadaNinjaskShedinjaVolbeatIllumiseKricketotKricketuneBurmyWormadamPlant CloakWormadamSandy CloakWormadamTrash CloakMothimCombeeVespiquenYanmegaSewaddleSwadloonLeavannyVenipedeWhirlipedeScolipedeDwebbleCrustleKarrablastEscavalierJoltikGalvantulaShelmetAccelgorDurantLarvestaVolcaronaGenesectScatterbugSpewpaVivillon' to numeric

The above exception was the direct cause of the following exception:

Traceback (most recent call last):
File "D:\PyCharm projects\pandastutorial\advanced.py", line 40, in 
print(df.groupby(['Type 1']).mean())
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 2452, in mean
result = self._cython_agg_general(
^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1998, in _cython_agg_general
new_mgr = data.grouped_reduce(array_func)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\internals\managers.py", line 1469, in grouped_reduce
applied = sb.apply(func)
^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\internals\blocks.py", line 393, in apply
result = func(self.values, **kwargs)
^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1995, in array_func
result = self._agg_py_fallback(how, values, ndim=data.ndim, alt=alt)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1946, in _agg_py_fallback
raise type(err)(msg) from err
TypeError: agg function failed [how->mean,dtype->object]
[/code]
Поскольку это проблема со строковыми значениями (это сработало для парня из руководства), я попробовал это:
[code]    print(df[['HP','Attack','Defense']].groupby(['Type 1']).mean())
[/code]
но он вернул еще одну ошибку:
[code]Traceback (most recent call last):
File "D:\PyCharm projects\pandastutorial\advanced.py", line 42, in 
print(df[['HP','Attack','Defense']].groupby(['Type 1']).mean())
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\frame.py", line 9183, in groupby
return DataFrameGroupBy(
^^^^^^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\groupby.py", line 1329, in __init__
grouper, exclusions, obj = get_grouper(
^^^^^^^^^^^^
File "D:\PyCharm projects\pandastutorial\venv\Lib\site-packages\pandas\core\groupby\grouper.py", line 1043, in get_grouper
raise KeyError(gpr)
KeyError: 'Type 1'
[/code]
Сработало следующее:
[code]    print(df.groupby(['Type 1']).agg({'Speed':'mean', 'Defense':'mean'}))

[/code]
но мне нужно среднее значение всех числовых значений, и я не хочу указывать его индивидуально. Я знаю, что это может быть полезно, когда вы указываете среднее значение для одного столбца и, например, минимальное значение для другого, но это раздражает, а иногда и невозможно для огромных баз данных. Есть ли способ сделать это быстрее? С уважением 

Подробнее здесь: [url]https://stackoverflow.com/questions/79134774/python-pandas-cant-use-mean-method-with-grouby[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как вернуть несколько статистических данных в виде нескольких столбцов в контексте Polars grouby?

Последнее сообщение Anonymous « 25 сен 2024, 18:00
Добавлено в форуме Python

Anonymous » 25 сен 2024, 18:00 » в форуме Python

Стоящая задача — выполнить множественную линейную регрессию по нескольким столбцам в контексте группировки и вернуть соответствующие бета-коэффициенты и связанные с ними значения t в отдельных столбцах.
Ниже приведена иллюстрация попытка сделать это...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
25 сен 2024, 18:00
Python использует oracledb для подключения к базе данных Oracle с помощью Pandas DataFrame Ошибка: «Pandas поддерживает

Последнее сообщение Anonymous « 27 ноя 2024, 00:35
Добавлено в форуме Python

Anonymous » 27 ноя 2024, 00:35 » в форуме Python

Я новичок в Python и еще новичок в Pandas, и надеюсь на некоторые рекомендации.
В моей компании есть локальная база данных Oracle DEV, к которой я пытаюсь подключиться с помощью Python. И Панды. После некоторого поиска я обнаружил, что рекомендуется...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
27 ноя 2024, 00:35
Python использует oracledb для подключения к базе данных Oracle с помощью Pandas DataFrame Ошибка: «Pandas поддерживает

Последнее сообщение Anonymous « 27 ноя 2024, 06:39
Добавлено в форуме Python

Anonymous » 27 ноя 2024, 06:39 » в форуме Python

Я новичок в Python и еще новичок в Pandas, и надеюсь на некоторые рекомендации.
В моей компании есть локальная база данных Oracle DEV, к которой я пытаюсь подключиться с помощью Python. И Панды. После некоторого поиска я обнаружил, что рекомендуется...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
27 ноя 2024, 06:39
Python использует oracledb для подключения к базе данных Oracle с помощью Pandas DataFrame Ошибка: «Pandas поддерживает

Последнее сообщение Anonymous « 29 ноя 2024, 00:27
Добавлено в форуме Python

Anonymous » 29 ноя 2024, 00:27 » в форуме Python

Я новичок в Python и еще новичок в Pandas, и надеюсь на некоторые рекомендации.
В моей компании есть локальная база данных Oracle DEV, к которой я пытаюсь подключиться с помощью Python. И Панды. После некоторого поиска я обнаружил, что рекомендуется...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
29 ноя 2024, 00:27
Python с использованием Oracledb для подключения к базе данных Oracle с ошибкой DataFrame Pandas: «Pandas поддерживает т

Последнее сообщение Anonymous « 05 авг 2025, 03:16
Добавлено в форуме Python

Anonymous » 05 авг 2025, 03:16 » в форуме Python

Я довольно новичок в Python и даже более новее для Pandas и надеюсь на некоторое руководство
У моей компании есть база данных Dev Oracle, к которой я пытаюсь подключиться к использованию Python & Pandas. После некоторого поиска я обнаружил, что для...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
05 авг 2025, 03:16

Вернуться в «Python»