Столбец недоступен с помощью groupby и apply (лямбда)

Столбец недоступен с помощью groupby и apply (лямбда) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Столбец недоступен с помощью groupby и apply (лямбда)

Цитата

Сообщение Anonymous » 24 сен 2024, 17:12

Я столкнулся с ошибкой KeyError при попытке использовать метод .apply() в DataFrame pandas после выполнения группировки. Цель состоит в том, чтобы рассчитать средневзвешенное значение на основе столбца Industry_adjusted_return. Ошибка указывает на то, что столбец «Industry_adjusted_return» не найден. Ниже приведен минимальный пример, воспроизводящий проблему:
```
import pandas as pd

# Creating a small DataFrame
data = {
'ISIN': ['DE000A1DAHH0', 'DE000KSAG888'],
'Date': ['2017-03-01', '2017-03-01'],
'MP_quintile': [0, 0],
'Mcap_w': [8089460.00, 4154519.75],
'Industry_adjusted_return': [-0.00869, 0.043052]
}

df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date']) # Ensure 'Date' is datetime type

Я использую Python 3.8 с версией pandas 1.3.3. Будем очень признательны за любую информацию о том, почему возникает эта ошибка и как ее исправить.
код:
for i,grouped in wa.groupby(['Date','MP_quintile']):
print(i,grouped)
weighted_average_returns = grouped.apply(lambda x: (x['Industry_adjusted_return'] * (x['Mcap_w'] / x['Mcap_w'].sum())).sum())

Ошибка
{
"name": "KeyError",
"message": "'Industry_adjusted_return'",
"stack": "---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
File c:\\Users\\mbkoo\\anaconda3\\envs\\myenv\\Lib\\site-packages\\pandas\\core\\indexes\\base.py:3802, in Index.get_loc(self, key, method, tolerance)
3801 try:
-> 3802 return self._engine.get_loc(casted_key)
3803 except KeyError as err:

File c:\\Users\\mbkoo\\anaconda3\\envs\\myenv\\Lib\\site-packages\\pandas\\_libs\\index.pyx:138, in pandas._libs.index.IndexEngine.get_loc()

File c:\\Users\\mbkoo\\anaconda3\\envs\\myenv\\Lib\\site-packages\\pandas\\_libs\\index.pyx:146, in pandas._libs.index.IndexEngine.get_loc()

File pandas\\_libs\\index_class_helper.pxi:49, in pandas._libs.index.Int64Engine._check_type()

KeyError: 'Industry_adjusted_return'

The above exception was the direct cause of the following exception:

KeyError Traceback (most recent call last)
Cell In[10], line 8
3 print(i,grouped)
4 #weighted_average_returns = grouped.apply( lambda x: ((x['Mcap_w'] / x['Mcap_w'].sum()))).sum()
5 # grouped['weights_EW'] = 1 / len(grouped)
6 # grouped['return_EW'] = grouped['Industry_adjusted_return'] * grouped['weights_EW']
----> 8 weighted_average_returns = grouped.apply(lambda x: (x['Industry_adjusted_return'] * (x['Mcap_w'] / x['Mcap_w'].sum())).sum()) #
9 # equally_weighted_returns=grouped['return_EW'].sum()
10 # # _df=cpd.from_dataframe(_df,allow_copy=True)
11 break

File c:\\Users\\pandas\\core\\frame.py:9568, in DataFrame.apply(self, func, axis, raw, result_type, args, **kwargs)
9557 from pandas.core.apply import frame_apply
9559 op = frame_apply(
9560 self,
9561 func=func,
(...)
9566 kwargs=kwargs,
9567 )
-> 9568 return op.apply().__finalize__(self, method=\"apply\")

File c:\\Users\\pandas\\core\\apply.py:764, in FrameApply.apply(self)
761 elif self.raw:
762 return self.apply_raw()
--> 764 return self.apply_standard()

File c:\\Users\\pandas\\core\\apply.py:891, in FrameApply.apply_standard(self)
890 def apply_standard(self):
--> 891 results, res_index = self.apply_series_generator()
893 # wrap results
894 return self.wrap_results(results, res_index)

File c:\\Users\\pandas\\core\\apply.py:907, in FrameApply.apply_series_generator(self)
904 with option_context(\"mode.chained_assignment\", None):
905 for i, v in enumerate(series_gen):
906 # ignore SettingWithCopy here in case the user mutates
--> 907 results = self.f(v)
908 if isinstance(results, ABCSeries):
909 # If we have a view on v, we need to make a copy because
910 # series_generator will swap out the underlying data
911 results = results.copy(deep=False)

Cell In[10], line 8, in (x)
3 print(i,grouped)
4 #weighted_average_returns = grouped.apply( lambda x: ((x['Mcap_w'] / x['Mcap_w'].sum()))).sum()
5 # grouped['weights_EW'] = 1 / len(grouped)
6 # grouped['return_EW'] = grouped['Industry_adjusted_return'] * grouped['weights_EW']
----> 8 weighted_average_returns = grouped.apply(lambda x: (x['Industry_adjusted_return'] * (x['Mcap_w'] / x['Mcap_w'].sum())).sum()) #
9 # equally_weighted_returns=grouped['return_EW'].sum()
10 # # _df=cpd.from_dataframe(_df,allow_copy=True)
11 break

File c:\\Users\\pandas\\core\\series.py:981, in Series.__getitem__(self, key)
978 return self._values[key]
980 elif key_is_scalar:
--> 981 return self._get_value(key)
983 if is_hashable(key):
984 # Otherwise index.get_value will raise InvalidIndexError
985 try:
986 # For labels that don't resolve as scalars like tuples and frozensets

File c:\\Users\\pandas\\core\\series.py:1089, in Series._get_value(self, label, takeable)
1086 return self._values[label]
1088 # Similar to Index.get_value, but we do not fall back to positional
-> 1089 loc = self.index.get_loc(label)
1090 return self.index._get_values_for_loc(self, loc, label)

File c:\\Users\\pandas\\core\\indexes\\base.py:3804, in Index.get_loc(self, key, method, tolerance)
3802 return self._engine.get_loc(casted_key)
3803 except KeyError as err:
-> 3804 raise KeyError(key) from err
3805 except TypeError:
3806 # If we have a listlike key, _check_indexing_error will raise
3807 # InvalidIndexError. Otherwise we fall through and re-raise
3808 # the TypeError.
3809 self._check_indexing_error(key)

KeyError: 'Industry_adjusted_return'"
}

Подробнее здесь: https://stackoverflow.com/questions/790 ... pplylambda

1727187148

Anonymous

Я столкнулся с ошибкой KeyError при попытке использовать метод .apply() в DataFrame pandas после выполнения группировки. Цель состоит в том, чтобы рассчитать средневзвешенное значение на основе столбца Industry_adjusted_return. Ошибка указывает на то, что столбец «Industry_adjusted_return» не найден. Ниже приведен минимальный пример, воспроизводящий проблему:
```
import pandas as pd

# Creating a small DataFrame
data = {
'ISIN': ['DE000A1DAHH0', 'DE000KSAG888'],
'Date': ['2017-03-01', '2017-03-01'],
'MP_quintile': [0, 0],
'Mcap_w': [8089460.00, 4154519.75],
'Industry_adjusted_return': [-0.00869, 0.043052]
}

df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date'])  # Ensure 'Date' is datetime type

Я использую Python 3.8 с версией pandas 1.3.3.  Будем очень признательны за любую информацию о том, почему возникает эта ошибка и как ее исправить.
код:
for i,grouped in wa.groupby(['Date','MP_quintile']):
print(i,grouped)
weighted_average_returns = grouped.apply(lambda x: (x['Industry_adjusted_return'] * (x['Mcap_w'] / x['Mcap_w'].sum())).sum())

Ошибка
{
"name": "KeyError",
"message": "'Industry_adjusted_return'",
"stack": "---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
File c:\\Users\\mbkoo\\anaconda3\\envs\\myenv\\Lib\\site-packages\\pandas\\core\\indexes\\base.py:3802, in Index.get_loc(self, key, method, tolerance)
3801 try:
-> 3802     return self._engine.get_loc(casted_key)
3803 except KeyError as err:

File c:\\Users\\mbkoo\\anaconda3\\envs\\myenv\\Lib\\site-packages\\pandas\\_libs\\index.pyx:138, in pandas._libs.index.IndexEngine.get_loc()

File c:\\Users\\mbkoo\\anaconda3\\envs\\myenv\\Lib\\site-packages\\pandas\\_libs\\index.pyx:146, in pandas._libs.index.IndexEngine.get_loc()

File pandas\\_libs\\index_class_helper.pxi:49, in pandas._libs.index.Int64Engine._check_type()

KeyError: 'Industry_adjusted_return'

The above exception was the direct cause of the following exception:

KeyError                                  Traceback (most recent call last)
Cell In[10], line 8
3  print(i,grouped)
4  #weighted_average_returns = grouped.apply( lambda x: ((x['Mcap_w'] / x['Mcap_w'].sum()))).sum()
5 # grouped['weights_EW'] = 1 / len(grouped)
6 # grouped['return_EW'] = grouped['Industry_adjusted_return'] * grouped['weights_EW']
----> 8  weighted_average_returns = grouped.apply(lambda x: (x['Industry_adjusted_return'] * (x['Mcap_w'] / x['Mcap_w'].sum())).sum()) #
9 # equally_weighted_returns=grouped['return_EW'].sum()
10 # # _df=cpd.from_dataframe(_df,allow_copy=True)
11  break

File c:\\Users\\pandas\\core\\frame.py:9568, in DataFrame.apply(self, func, axis, raw, result_type, args, **kwargs)
9557 from pandas.core.apply import frame_apply
9559 op = frame_apply(
9560     self,
9561     func=func,
(...)
9566     kwargs=kwargs,
9567 )
-> 9568 return op.apply().__finalize__(self, method=\"apply\")

File c:\\Users\\pandas\\core\\apply.py:764, in FrameApply.apply(self)
761 elif self.raw:
762     return self.apply_raw()
--> 764 return self.apply_standard()

File c:\\Users\\pandas\\core\\apply.py:891, in FrameApply.apply_standard(self)
890 def apply_standard(self):
--> 891     results, res_index = self.apply_series_generator()
893     # wrap results
894     return self.wrap_results(results, res_index)

File c:\\Users\\pandas\\core\\apply.py:907, in FrameApply.apply_series_generator(self)
904 with option_context(\"mode.chained_assignment\", None):
905     for i, v in enumerate(series_gen):
906         # ignore SettingWithCopy here in case the user mutates
--> 907         results[i] = self.f(v)
908         if isinstance(results[i], ABCSeries):
909             # If we have a view on v, we need to make a copy because
910             #  series_generator will swap out the underlying data
911             results[i] = results[i].copy(deep=False)

Cell In[10], line 8, in (x)
3  print(i,grouped)
4  #weighted_average_returns = grouped.apply( lambda x: ((x['Mcap_w'] / x['Mcap_w'].sum()))).sum()
5 # grouped['weights_EW'] = 1 / len(grouped)
6 # grouped['return_EW'] = grouped['Industry_adjusted_return'] * grouped['weights_EW']
----> 8  weighted_average_returns = grouped.apply(lambda x: (x['Industry_adjusted_return'] * (x['Mcap_w'] / x['Mcap_w'].sum())).sum()) #
9 # equally_weighted_returns=grouped['return_EW'].sum()
10 # # _df=cpd.from_dataframe(_df,allow_copy=True)
11  break

File c:\\Users\\pandas\\core\\series.py:981, in Series.__getitem__(self, key)
978     return self._values[key]
980 elif key_is_scalar:
-->  981     return self._get_value(key)
983 if is_hashable(key):
984     # Otherwise index.get_value will raise InvalidIndexError
985     try:
986         # For labels that don't resolve as scalars like tuples and frozensets

File c:\\Users\\pandas\\core\\series.py:1089, in Series._get_value(self, label, takeable)
1086     return self._values[label]
1088 # Similar to Index.get_value, but we do not fall back to positional
-> 1089 loc = self.index.get_loc(label)
1090 return self.index._get_values_for_loc(self, loc, label)

File c:\\Users\\pandas\\core\\indexes\\base.py:3804, in Index.get_loc(self, key, method, tolerance)
3802     return self._engine.get_loc(casted_key)
3803 except KeyError as err:
-> 3804     raise KeyError(key) from err
3805 except TypeError:
3806     # If we have a listlike key, _check_indexing_error will raise
3807     #  InvalidIndexError. Otherwise we fall through and re-raise
3808     #  the TypeError.
3809     self._check_indexing_error(key)

KeyError: 'Industry_adjusted_return'"
}
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79019014/column-is-not-accessible-using-groupby-and-applylambda[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

TempercationWarning с GroupBy (). Apply (): как правильно исключить групповую колонку в Pandas 2.2+

Последнее сообщение Anonymous « 12 мар 2025, 09:26
Добавлено в форуме Python

Anonymous » 12 мар 2025, 09:26 » в форуме Python

Я в Pandas 2.2.1 с Python 3.9.19 Пытаюсь попробовать 5 строк на группу с использованием GroupBy (). Apply () , но я продолжаю получать эту терапевту в Pandas 2.2+:
DeprecationWarning: DataFrameGroupBy.apply operated on the grouping columns.
This...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
12 мар 2025, 09:26
Groupby.apply (myfunction) Возврат пустой датчик

Последнее сообщение Anonymous « 03 июл 2025, 17:11
Добавлено в форуме Python

Anonymous » 03 июл 2025, 17:11 » в форуме Python

У меня проблемы с Groupby.apply (myfunction), я получаю и пустую DataFrmae в результате. import pandas as pd
import dask.dataframe as dd

data = {'zipcode': ,
'property_type': ,
'median_dom': ,
'median_sale_price': ,
'median_ppsf': ,
}

df =...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
03 июл 2025, 17:11
Предупреждение об испаке с Groupby.apply

Последнее сообщение Anonymous « 15 авг 2025, 11:37
Добавлено в форуме Python

Anonymous » 15 авг 2025, 11:37 » в форуме Python

У меня есть скрипт Python, который считывается в данных из файла CSV
Код работает нормально, но каждый раз, когда он запускается, я получаю это сообщение об испаке:
DeprecationWarning: DataFrameGroupBy.apply operated on the grouping columns. This...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
15 авг 2025, 11:37
Предупреждение об испаке с Groupby.apply

Последнее сообщение Anonymous « 16 авг 2025, 09:08
Добавлено в форуме Python

Anonymous » 16 авг 2025, 09:08 » в форуме Python

У меня есть скрипт Python, который считывается в данных из файла CSV
Код работает нормально, но каждый раз, когда он запускается, я получаю это сообщение об испаке:
DeprecationWarning: DataFrameGroupBy.apply operated on the grouping columns. This...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
16 авг 2025, 09:08
Запрашивал десериализацию слоя лямбда с помощью Python `лямбда -` внутри. Вы можете перенести `safe_mode = false` на фун

Последнее сообщение Anonymous « 01 фев 2025, 13:48
Добавлено в форуме Python

Anonymous » 01 фев 2025, 13:48 » в форуме Python

Это проект колбы и модель Keras, я получаю следующую ошибку при запуске
C:\Users\winne\AppData\Local\Programs\Python\Python311\Lib\site-packages\keras\src\layers\core\lambda_layer.py , line 394, in _parse_function_from_config
raise ValueError(...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
01 фев 2025, 13:48

Вернуться в «Python»