Коррекция данных в Pandas/Python ⇐ Python
Коррекция данных в Pandas/Python
Мне нужно обновить данные подмножества моего df значениями, рассчитанными на основе подмножества моего фрейма данных.
PERSNR
XYZ
ДАТА
ЗНАЧЕНИЕ
22222
а
январь
0,8
22222
b
Ян
0,2
22222
a
Фев
0,8
22222
b
Фев
0,2
У меня есть Dataframe примерно с 8000 PERSNR, который выглядит так, только с гораздо большим количеством столбцов
Для подмножества, которое я уже знаю (у меня есть список PERSNR для его фильтрации), мне нужно сложить значения вместе, игнорируя XYZ
Я могу сделать это с помощью Pivot_table, и я могу получить из него еще один df.
Проблема, с которой я столкнулся, заключается в том, что мне нужно впоследствии обновить значения в моем исходном DF.
Моя цель — получить следующее, не теряя при этом никаких других данных моего DF.
PERSNR
XYZ
ДАТА
VALUE
22222
а
январь
1,0
22222
b
Ян
0,0
в Excel я бы выполнил суммирование мой столбец значений в моих PERSNR, XYZ и DATE.
а затем я бы заменил свои значения на vlookup в столбце значений и перезаписал значения с идентификатором XYZ «b» на ноль. Это всегда будет ноль.
Есть предложения, как это сделать?
Заранее спасибо
Майк
Источник: https://stackoverflow.com/questions/781 ... das-python
Мне нужно обновить данные подмножества моего df значениями, рассчитанными на основе подмножества моего фрейма данных.
PERSNR
XYZ
ДАТА
ЗНАЧЕНИЕ
22222
а
январь
0,8
22222
b
Ян
0,2
22222
a
Фев
0,8
22222
b
Фев
0,2
У меня есть Dataframe примерно с 8000 PERSNR, который выглядит так, только с гораздо большим количеством столбцов
Для подмножества, которое я уже знаю (у меня есть список PERSNR для его фильтрации), мне нужно сложить значения вместе, игнорируя XYZ
Я могу сделать это с помощью Pivot_table, и я могу получить из него еще один df.
Проблема, с которой я столкнулся, заключается в том, что мне нужно впоследствии обновить значения в моем исходном DF.
Моя цель — получить следующее, не теряя при этом никаких других данных моего DF.
PERSNR
XYZ
ДАТА
VALUE
22222
а
январь
1,0
22222
b
Ян
0,0
в Excel я бы выполнил суммирование мой столбец значений в моих PERSNR, XYZ и DATE.
а затем я бы заменил свои значения на vlookup в столбце значений и перезаписал значения с идентификатором XYZ «b» на ноль. Это всегда будет ноль.
Есть предложения, как это сделать?
Заранее спасибо
Майк
Источник: https://stackoverflow.com/questions/781 ... das-python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение