Должен ли я удалять дубликаты перед объединением двух DataFrame или после объединения?Python

Программы на Python
Anonymous
 Должен ли я удалять дубликаты перед объединением двух DataFrame или после объединения?

Сообщение Anonymous »

У меня есть два DataFrame в pandas: клиенты и рейсы. Оба содержат дубликаты ключа присоединения (Loyalty#). Я не уверен, что правильный рабочий процесс — удалять дубликаты перед слиянием или сначала сливать, а затем выполнять дедупликацию.
Пример эксперта из тестов:

Код: Выделить всё

Loyalty#  Year  Month  YearMonthDate  NumFlights  ...
101902    2019     1   2019-01-01     0.0         ...
101902    2019     1   2019-01-01     0.0         ...   

Подробнее здесь: [url]https://stackoverflow.com/questions/79802715/should-i-drop-duplicates-before-merging-two-dataframes-or-after-the-merge[/url]

Вернуться в «Python»