df = pd.DataFrame(data={
'a':[1,2,3,4,1,2,3,4,5],
'b':[1,4,2,2,1,2,1,1,2],
'c':[1000, 10, 500, 100,100, 10, 500, 100, 10]
})
< /code>
, который выглядит как < /p>
a b c
0 1 1 1000
1 2 4 10
2 3 2 500
3 4 2 100
4 1 1 100
5 2 2 10
6 3 1 500
7 4 1 100
8 5 2 10
< /code>
Я пытаюсь выполнить операцию в столбце C, чтобы создать новый столбец D на основе значений в столбцах A и B, в данном случае сумма C для уникальных пар A и B. Например, первая запись будет суммой столбца C для строк, которые a = 1 и b = 1 (в этом случае 1000+100 = 1100). Далее будет сумма C для A = 2 и B = 4 и т. Д. Как я могу сделать это, не зацикливаясь по рядам индивидуально? Я знаю, что GroupBy ()
может сделать нечто подобное, но фактическая функция, которую я пытаюсь применить, более сложна, чем просто sum () , и мне нужно сохранить исходный кофром.
У меня есть DataFrame < /p> [code]df = pd.DataFrame(data={ 'a':[1,2,3,4,1,2,3,4,5], 'b':[1,4,2,2,1,2,1,1,2], 'c':[1000, 10, 500, 100,100, 10, 500, 100, 10] }) < /code> , который выглядит как < /p> a b c 0 1 1 1000 1 2 4 10 2 3 2 500 3 4 2 100 4 1 1 100 5 2 2 10 6 3 1 500 7 4 1 100 8 5 2 10 < /code> Я пытаюсь выполнить операцию в столбце C, чтобы создать новый столбец D на основе значений в столбцах A и B, в данном случае сумма C для уникальных пар A и B. Например, первая запись будет суммой столбца C для строк, которые a = 1 и b = 1 (в этом случае 1000+100 = 1100). Далее будет сумма C для A = 2 и B = 4 и т. Д. Как я могу сделать это, не зацикливаясь по рядам индивидуально? Я знаю, что GroupBy () [/code] может сделать нечто подобное, но фактическая функция, которую я пытаюсь применить, более сложна, чем просто sum () , и мне нужно сохранить исходный кофром.
Я хочу применить свою пользовательскую функцию (она использует лестницу if-else) к этим шести столбцам (ERI_Hispanic, ERI_AMERIND_AKNATV , ERI_ASIAN , ERI_BLACK_AFR.AMER , ERI_HI_PACISL , ERI_WHITE ) в каждом ряду моего DataFrame. Критической частью...
Я хочу применить свою пользовательскую функцию (она использует лестницу if-else) к этим шести столбцам (ERI_Hispanic, ERI_AMERIND_AKNATV , ERI_ASIAN , ERI_BLACK_AFR.AMER , ERI_HI_PACISL , ERI_WHITE ) в каждом ряду моего DataFrame. Критической частью...
Для следующего df я хочу изменить значения в столбцах A , B и c к таковым в столбцах x , Y и z , с учетом логического выбора в столбце B .
columns = { A : ,
B : ,
C : ,
X : ,
Y : ,
Z : }
У меня есть Pandas DataFrame, который выглядит при этом (имена и значения столбцов не являются репрезентативными):
A | B | C | D | E | F | G ...| X | Z
a0|a0 |c0 |d0 |e0 |f0 | g0 | x0| z0
a1|b1 |c1 |d1 |e1 |f1 | g1 | x1| z1
a2|b2 |c2 |d2 |e2 |f2 |...
У меня есть Pandas DataFrame, который выглядит при этом (имена и значения столбцов не являются репрезентативными):
A | B | C | D | E | F | G ...| X | Z
a0|a0 |c0 |d0 |e0 |f0 | g0 | x0| z0
a1|b1 |c1 |d1 |e1 |f1 | g1 | x1| z1
a2|b2 |c2 |d2 |e2 |f2 |...