Я новичок в Pandas и хочу объединить два набора данных с похожими столбцами. Каждый столбец будет иметь несколько уникальных значений по сравнению с другим столбцом, а также множество идентичных значений. В каждом столбце есть дубликаты, которые я хотел бы сохранить. Мой желаемый результат показан ниже. Добавление How='inner' или 'outer' не дает желаемого результата.
import pandas as pd
df1 = df2 = pd.DataFrame({'A': [2,2,3,4,5]})
print(pd.merge(df1,df2))
output:
A
0 2
1 2
2 2
3 2
4 3
5 4
6 5
desired/expected output:
A
0 2
1 2
2 3
3 4
4 5
Пожалуйста, дайте мне знать, как/если я смогу добиться желаемого результата с помощью слияния, спасибо!
РЕДАКТИРОВАТЬЧтобы прояснить, почему меня смущает такое поведение, если я просто добавлю еще один столбец, получится не четыре двойки, а всего две двойки, поэтому я ожидаю, что в моем первом примере он также будет иметь две двойки. Почему поведение меняется, что делают панды?
import pandas as pd
df1 = df2 = pd.DataFrame(
{'A': [2,2,3,4,5], 'B': ['red','orange','yellow','green','blue']}
)
print(pd.merge(df1,df2))
output:
A B
0 2 red
1 2 orange
2 3 yellow
3 4 green
4 5 blue
However, based on the first example I would expect:
A B
0 2 red
1 2 orange
2 2 red
3 2 orange
4 3 yellow
5 4 green
6 5 blue
Подробнее здесь: https://stackoverflow.com/questions/424 ... te-entries
Слияние Pandas создает нежелательные повторяющиеся записи ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Firebase Cloud Messaging генерирует повторяющиеся или повторяющиеся токены (fcm) [закрыто]
Anonymous » » в форуме Php - 0 Ответы
- 20 Просмотры
-
Последнее сообщение Anonymous
-