Панды присоединяются к 2 фреймам данных на основе рейтинга

Панды присоединяются к 2 фреймам данных на основе рейтинга ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Панды присоединяются к 2 фреймам данных на основе рейтинга

Цитата

Сообщение Anonymous » 12 окт 2024, 22:11

Скажем, у меня есть 2 фрейма данных с 3 общими идентификационными столбцами.

Код: Выделить всё

dataframe1

id1  id2  id3  value1 value2    value3
1001 9001 3001 blue   square    true

dataframe2
id1  id2  id3  valuex valuey valuez
1001 9001 3001 1000   2.5    5
1001 null null 200    1.0    3
null 9001 null 200    5.4    0
null 9001 3001 1000   3.5    6
1001 9001 null 1001   4.5    7
1001 null 3001 1001   4.5    7

В этом примере я могу сопоставить строку в dataframe1 с несколькими строками в dataframe2. Я хочу назначить рейтинг на основе совпадения столбцов и объединить их с использованием наивысшего рейтинга.
Я хочу объединить dataframe1 и dataframe2 на основе ранжирования между столбцами идентификаторов id1, id2 и id3, если 3 столбцы совпадают, я хочу учитывать, что самый высокий рейтинг и присоединиться, и игнорировать другие строки, которые соответствуют id1 и id2 или id2 и id3 и т. д., если 3 столбца не совпадают, я хочу рассмотреть строки, в которых 2 столбца идентификаторов совпадают, и расставить приоритеты - скажем, если есть 2 строки с двумя идентификаторами, совпадающими, например, id1 и id2, id2 и id3, я хочу установить приоритет id2 и id3 (это означает, что они получат более высокий рейтинг).
Как это сделать? я собираюсь об этом? Я бы предпочел использовать функцию для расчета рейтинга, чтобы можно было реализовать сложную логику.

Подробнее здесь: https://stackoverflow.com/questions/790 ... on-ranking

1728760294

Anonymous

Скажем, у меня есть 2 фрейма данных с 3 общими идентификационными столбцами.
[code]dataframe1

id1  id2  id3  value1 value2    value3
1001 9001 3001 blue   square    true

dataframe2
id1  id2  id3  valuex valuey valuez
1001 9001 3001 1000   2.5    5
1001 null null 200    1.0    3
null 9001 null 200    5.4    0
null 9001 3001 1000   3.5    6
1001 9001 null 1001   4.5    7
1001 null 3001 1001   4.5    7

[/code]
В этом примере я могу сопоставить строку в dataframe1 с несколькими строками в dataframe2. Я хочу назначить рейтинг на основе совпадения столбцов и объединить их с использованием наивысшего рейтинга.
Я хочу объединить dataframe1 и dataframe2 на основе ранжирования между столбцами идентификаторов id1, id2 и id3, если 3 столбцы совпадают, я хочу учитывать, что самый высокий рейтинг и присоединиться, и игнорировать другие строки, которые соответствуют id1 и id2 или id2 и id3 и т. д., если 3 столбца не совпадают, я хочу рассмотреть строки, в которых 2 столбца идентификаторов совпадают, и расставить приоритеты - скажем, если есть 2 строки с двумя идентификаторами, совпадающими, например, id1 и id2, id2 и id3, я хочу установить приоритет id2 и id3 (это означает, что они получат более высокий рейтинг).
Как это сделать? я собираюсь об этом? Я бы предпочел использовать функцию для расчета рейтинга, чтобы можно было реализовать сложную логику. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79081648/pandas-join-2-dataframes-based-on-ranking[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Панды присоединяются к мультииндексу и NaN

Последнее сообщение Anonymous « 31 дек 2023, 06:42
Добавлено в форуме Python

Anonymous » 31 дек 2023, 06:42 » в форуме Python

Я использую Pandas 2.1.3.

Я пытаюсь объединить два фрейма данных на нескольких уровнях индекса, и на одном из уровней индекса есть NA. Минимально воспроизводимый пример выглядит примерно так:

a = pd.DataFrame({ 'idx_a': , 'idx_b': , 'idx_c': ,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
31 дек 2023, 06:42
Сортировка данных по фреймам данных, содержащих смешанные буквенно-цифровые символы

Последнее сообщение Anonymous « 07 ноя 2024, 09:32
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 09:32 » в форуме Python

Проблема:
Попытка отсортировать приведенный ниже фрейм данных для данных Excel (обратите внимание, что это небольшой образец набора из нескольких строк с информацией, которая может варьироваться от A# до Z#, за которой следует AA#). и т. д....

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 09:32
Сортировка данных по фреймам данных, содержащих смешанные буквенно-цифровые символы

Последнее сообщение Anonymous « 07 ноя 2024, 10:50
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 10:50 » в форуме Python

Проблема:
Попытка отсортировать приведенный ниже фрейм данных для данных Excel (обратите внимание, что это небольшой образец набора из нескольких строк с информацией, которая может варьироваться от A# до Z#, за которой следует AA#). и т. д....

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 10:50
Сортировка данных по фреймам данных, содержащих смешанные буквенно-цифровые символы

Последнее сообщение Anonymous « 07 ноя 2024, 13:03
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 13:03 » в форуме Python

Проблема:
Попытка отсортировать приведенный ниже фрейм данных для данных Excel (обратите внимание, что это небольшой образец набора из нескольких строк с информацией, которая может варьироваться от A# до Z#, за которой следует AA#). и т. д....

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 13:03
Сортировка данных по фреймам данных, содержащих смешанные буквенно-цифровые символы

Последнее сообщение Anonymous « 07 ноя 2024, 13:43
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 13:43 » в форуме Python

Проблема:
Попытка отсортировать приведенный ниже фрейм данных для данных Excel (обратите внимание, что это небольшой образец набора из нескольких строк с информацией, которая может варьироваться от A# до Z#, за которой следует AA#). и т. д....

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 13:43

Вернуться в «Python»