У меня есть DataFrame, который я хочу объединить и удалить только повторяющиеся значения на основе имени столбца и строки. Например, key_x и key_y имеют
одинаковые значения в одной и той же строке в строке 0,3,10,12,15.
My DataFrame
import pandas as pd
df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'A'], 'value1': [1, 2, 3, 4]})
Я попробовал этот код ниже, который работает при слиянии, но как удалить повторяющиеся значения на основе имени столбца, если значение находится в той же строке.
merged_df = df1.merge(df1, how='cross')
print(merged_df)
key_x value1_x key_y value1_y
0 A 1 A 1 # Duplicate A
1 A 1 B 2
2 A 1 C 3
3 A 1 A 4 # Duplicate A
4 B 2 A 1
5 B 2 B 2
6 B 2 C 3
7 B 2 A 4
8 C 3 A 1
9 C 3 B 2
10 C 3 C 3 # Duplicate C
11 C 3 A 4
12 A 4 A 1 # Duplicate A
13 A 4 B 2
14 A 4 C 3
15 A 4 A 4 # Duplicate A
Мне бы хотелось, чтобы мой результат был примерно таким:
key_x value1_x key_y value1_y
1 A 1 B 2
2 A 1 C 3
4 B 2 A 1
6 B 2 C 3
7 B 2 A 4
8 C 3 A 1
9 C 3 B 2
11 C 3 A 4
13 A 4 B 2
14 A 4 C 3
Подробнее здесь: https://stackoverflow.com/questions/797 ... dataframes