Слияние Pandas создает нежелательные повторяющиеся записи

Слияние Pandas создает нежелательные повторяющиеся записи ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Слияние Pandas создает нежелательные повторяющиеся записи

Цитата

Сообщение Anonymous » 14 окт 2024, 04:53

Я новичок в Pandas и хочу объединить два набора данных с похожими столбцами. Каждый столбец будет иметь несколько уникальных значений по сравнению с другим столбцом, а также множество идентичных значений. В каждом столбце есть дубликаты, которые я хотел бы сохранить. Мой желаемый результат показан ниже. Добавление How='inner' или 'outer' не дает желаемого результата.
import pandas as pd

df1 = df2 = pd.DataFrame({'A': [2,2,3,4,5]})

print(pd.merge(df1,df2))

output:
A
0 2
1 2
2 2
3 2
4 3
5 4
6 5

desired/expected output:
A
0 2
1 2
2 3
3 4
4 5

Пожалуйста, дайте мне знать, как/если я смогу добиться желаемого результата с помощью слияния, спасибо!
РЕДАКТИРОВАТЬЧтобы прояснить, почему меня смущает такое поведение, если я просто добавлю еще один столбец, получится не четыре двойки, а всего две двойки, поэтому я ожидаю, что в моем первом примере он также будет иметь две двойки. Почему поведение меняется, что делают панды?
import pandas as pd
df1 = df2 = pd.DataFrame(
{'A': [2,2,3,4,5], 'B': ['red','orange','yellow','green','blue']}
)

print(pd.merge(df1,df2))

output:
A B
0 2 red
1 2 orange
2 3 yellow
3 4 green
4 5 blue

However, based on the first example I would expect:
A B
0 2 red
1 2 orange
2 2 red
3 2 orange
4 3 yellow
5 4 green
6 5 blue

Подробнее здесь: https://stackoverflow.com/questions/424 ... te-entries

1728870803

Anonymous

Я новичок в Pandas и хочу объединить два набора данных с похожими столбцами. Каждый столбец будет иметь несколько уникальных значений по сравнению с другим столбцом, а также множество идентичных значений. В каждом столбце есть дубликаты, которые я хотел бы сохранить. Мой желаемый результат показан ниже. Добавление How='inner' или 'outer' не дает желаемого результата.
import pandas as pd

df1 = df2 = pd.DataFrame({'A': [2,2,3,4,5]})

print(pd.merge(df1,df2))

output:
A
0  2
1  2
2  2
3  2
4  3
5  4
6  5

desired/expected output:
A
0  2
1  2
2  3
3  4
4  5

Пожалуйста, дайте мне знать, как/если я смогу добиться желаемого результата с помощью слияния, спасибо!
[b]РЕДАКТИРОВАТЬ[/b]Чтобы прояснить, почему меня смущает такое поведение, если я просто добавлю еще один столбец, получится не четыре двойки, а всего две двойки, поэтому я ожидаю, что в моем первом примере он также будет иметь две двойки. Почему поведение меняется, что делают панды?
import pandas as pd
df1 = df2 = pd.DataFrame(
{'A': [2,2,3,4,5], 'B': ['red','orange','yellow','green','blue']}
)

print(pd.merge(df1,df2))

output:
A       B
0  2     red
1  2  orange
2  3  yellow
3  4   green
4  5    blue

However, based on the first example I would expect:
A       B
0  2     red
1  2  orange
2  2     red
3  2  orange
4  3  yellow
5  4   green
6  5    blue
 

Подробнее здесь: [url]https://stackoverflow.com/questions/42444078/pandas-merge-creates-unwanted-duplicate-entries[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Socket-io-клиент получает повторяющиеся повторяющиеся данные по событию

Последнее сообщение Гость « 20 сен 2023, 18:49
Добавлено в форуме Javascript

Гость » 20 сен 2023, 18:49 » в форуме Javascript

Почему я получаю несколько данных, полученных из события сокета-io?

Это клиентская часть (реакция)

//инициализированный сокет-io-клиент// сокет.connect(); socket.on( получить-сообщение , (incomingMessage) => { console.log(incomingMessage); >!...

0 Ответы

129 Просмотры

Последнее сообщение Гость
20 сен 2023, 18:49
Как удалить пары «ключ-значение», имеющие повторяющиеся (повторяющиеся) значения из словаря [закрыто]

Последнее сообщение Anonymous « 25 ноя 2024, 22:47
Добавлено в форуме Python

Anonymous » 25 ноя 2024, 22:47 » в форуме Python

Как удалить из словаря пары «ключ-значение», имеющие повторяющиеся значения. Словарь может состоять из ключей без значений или значений без ключей.
Я пробовал так:
k = input('keys: ')
v = input('values: ')
l1 = list(map(int, k.split(',')))
l2 =...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
25 ноя 2024, 22:47
Firebase Cloud Messaging генерирует повторяющиеся или повторяющиеся токены (fcm) [закрыто]

Последнее сообщение Anonymous « 18 дек 2024, 15:14
Добавлено в форуме Php

Anonymous » 18 дек 2024, 15:14 » в форуме Php

Я создал и поддерживаю онлайн-систему, которая управляет контентом из приложения, которое использует Firebase Cloud Messaging для отправки уведомлений. Однако по неизвестным мне до сих пор причинам несколько записей FCM (поскольку мы запускаем...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
18 дек 2024, 15:14
MSAL пропускает запрос пароля и отображает нежелательные учетные записи «Подключено в Windows».

Последнее сообщение Anonymous « 21 янв 2025, 16:23
Добавлено в форуме C#

Anonymous » 21 янв 2025, 16:23 » в форуме C#

Контекст:
Я создаю приложение .NET Framework 4.8, в котором пользователи должны войти в систему, используя свою текущую учетную запись организации Windows (Azure AD). Цель состоит в том, чтобы обеспечить проверку подлинности только для той учетной...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
21 янв 2025, 16:23
MSAL пропускает запрос пароля и отображает нежелательные учетные записи «Подключено в Windows».

Последнее сообщение Anonymous « 21 янв 2025, 18:06
Добавлено в форуме C#

Anonymous » 21 янв 2025, 18:06 » в форуме C#

Контекст:
Я создаю приложение .NET Framework 4.8, в котором пользователи должны входить в систему с учетной записью организации (Azure AD). Цель состоит в том, чтобы обеспечить аутентификацию без показа других учетных записей Microsoft, которые...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
21 янв 2025, 18:06

Вернуться в «Python»