Слияние Pandas создает нежелательные повторяющиеся записиPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Слияние Pandas создает нежелательные повторяющиеся записи

Сообщение Anonymous »

Я новичок в Pandas и хочу объединить два набора данных с похожими столбцами. Каждый столбец будет иметь несколько уникальных значений по сравнению с другим столбцом, а также множество идентичных значений. В каждом столбце есть дубликаты, которые я хотел бы сохранить. Мой желаемый результат показан ниже. Добавление How='inner' или 'outer' не дает желаемого результата.
import pandas as pd

df1 = df2 = pd.DataFrame({'A': [2,2,3,4,5]})

print(pd.merge(df1,df2))

output:
A
0 2
1 2
2 2
3 2
4 3
5 4
6 5

desired/expected output:
A
0 2
1 2
2 3
3 4
4 5

Пожалуйста, дайте мне знать, как/если я смогу добиться желаемого результата с помощью слияния, спасибо!
РЕДАКТИРОВАТЬЧтобы прояснить, почему меня смущает такое поведение, если я просто добавлю еще один столбец, получится не четыре двойки, а всего две двойки, поэтому я ожидаю, что в моем первом примере он также будет иметь две двойки. Почему поведение меняется, что делают панды?
import pandas as pd
df1 = df2 = pd.DataFrame(
{'A': [2,2,3,4,5], 'B': ['red','orange','yellow','green','blue']}
)

print(pd.merge(df1,df2))

output:
A B
0 2 red
1 2 orange
2 3 yellow
3 4 green
4 5 blue

However, based on the first example I would expect:
A B
0 2 red
1 2 orange
2 2 red
3 2 orange
4 3 yellow
5 4 green
6 5 blue


Подробнее здесь: https://stackoverflow.com/questions/424 ... te-entries
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»