Есть ли разумный способ объединить два DataFrame на основе критериев подстроки? - Цифровое Кемерово

Есть ли разумный способ объединить два DataFrame на основе критериев подстроки? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Есть ли разумный способ объединить два DataFrame на основе критериев подстроки?

Цитата

Сообщение Anonymous » 23 сен 2024, 23:43

В настоящее время я работаю с некоторыми номерами телефонов DataFrames, и мне нужно объединить их по критериям подстроки, и это должно быть левое слияние (то есть иметь все комбинации в случае, если совпадений более 1). >
Например, эти 2 DataFrame:
(идентификаторы здесь для иллюстрации)
ТЕЛЕФОНЫ

Код: Выделить всё

| id |     phone    |
| -- | ------------ |
| 1  | +12399998888 |
| 2  | +12377776666 |
| 3  | +1233399998888 |

PHONES_NO_EXT

Код: Выделить всё

| id |  phone   |
| -- | -------- |
| 1  | 99998888 |
| 2  | 99998888 |
| 3  | 77776666 |

RESULT_NEEDED

Код: Выделить всё

| id |     phone    |  phone_no_ext |
| -- | ------------ | ------------- |
| 1  | +12399998888 |    99998888   |
| 1  | +12399998888 |    99998888   |
| 2  | +12377776666 |    77776666   |
| 3  | +1233399998888 |    99998888   |
| 3  | +1233399998888 |    99998888   |

Обратите внимание, что у вас всегда есть как минимум 1 совпадение из PHONES_NO_EXT, принадлежащее PHONES.
Посмотрите на идентификатор 3 PHONES, узнать это невозможно префикс, но это совпадение все равно необходимо.
Один из подходов заключался в выполнении всех комбинаций (создание строк len(PHONES) * len(PHONES_NO_EXT) в новом DataFrame), а затем создание df.apply для фильтрации на основе подстроки (вы можете себе представить, что это решение невозможно масштабировать).
Как выполнить это слияние наиболее эффективным способом?

Подробнее здесь: https://stackoverflow.com/questions/790 ... g-criteria

Реклама

1727124202

Anonymous

В настоящее время я работаю с некоторыми номерами телефонов DataFrames, и мне нужно объединить их по критериям подстроки, и это должно быть левое слияние (то есть иметь все комбинации в случае, если совпадений более 1). >
Например, эти 2 DataFrame:
(идентификаторы здесь для иллюстрации)
ТЕЛЕФОНЫ
[code]| id |     phone    |
| -- | ------------ |
| 1  | +12399998888 |
| 2  | +12377776666 |
| 3  | +1233399998888 |
[/code]
PHONES_NO_EXT
[code]| id |  phone   |
| -- | -------- |
| 1  | 99998888 |
| 2  | 99998888 |
| 3  | 77776666 |
[/code]
RESULT_NEEDED
[code]| id |     phone    |  phone_no_ext |
| -- | ------------ | ------------- |
| 1  | +12399998888 |    99998888   |
| 1  | +12399998888 |    99998888   |
| 2  | +12377776666 |    77776666   |
| 3  | +1233399998888 |    99998888   |
| 3  | +1233399998888 |    99998888   |
[/code]
Обратите внимание, что у вас всегда есть как минимум 1 совпадение из PHONES_NO_EXT, принадлежащее PHONES.
Посмотрите на идентификатор 3 PHONES, узнать это невозможно префикс, но это совпадение все равно необходимо.
Один из подходов заключался в выполнении всех комбинаций (создание строк len(PHONES) * len(PHONES_NO_EXT) в новом DataFrame), а затем создание df.apply для фильтрации на основе подстроки (вы можете себе представить, что это решение невозможно масштабировать).
Как выполнить это слияние наиболее эффективным способом? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79016179/is-there-a-smart-way-to-merge-2-dataframes-based-on-substring-criteria[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Панды - более разумный способ разделить некоторые столбцы на DataFrame на другой DataFrame

Последнее сообщение Anonymous « 20 фев 2025, 20:25
Добавлено в форуме Python

Anonymous » 20 фев 2025, 20:25 » в форуме Python

У меня есть DataFrame df1 , который имеет годовой столбец и цифровые столбцы. Значения года в DF1 не являются уникальными. Я хотел бы нормализовать числовые столбцы df1 на годовом уровне, используя определенную функцию. Для этой цели у меня есть еще...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 20:25
Панды - более разумный способ разделить некоторые столбцы на DataFrame на другой DataFrame

Последнее сообщение Anonymous « 20 фев 2025, 21:56
Добавлено в форуме Python

Anonymous » 20 фев 2025, 21:56 » в форуме Python

У меня есть DataFrame df1 , который имеет столбец года и цифровые столбцы. Значения года в DF1 не являются уникальными. Я хотел бы нормализовать числовые столбцы DF1 на годовом уровне, используя определенную функцию. Для этого у меня есть еще один...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 21:56
Панды - более разумный способ разделить некоторые столбцы на DataFrame на другой DataFrame

Последнее сообщение Anonymous « 21 фев 2025, 13:31
Добавлено в форуме Python

Anonymous » 21 фев 2025, 13:31 » в форуме Python

У меня есть DataFrame df1 , который имеет столбец года и цифровые столбцы. Значения года в DF1 не являются уникальными. Я хотел бы нормализовать числовые столбцы DF1 на годовом уровне, используя определенную функцию. Для этого у меня есть еще один...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
21 фев 2025, 13:31
Панды - более разумный способ разделить некоторые столбцы на DataFrame на другой DataFrame

Последнее сообщение Anonymous « 21 фев 2025, 23:13
Добавлено в форуме Python

Anonymous » 21 фев 2025, 23:13 » в форуме Python

У меня есть DataFrame df1 , который имеет столбец года и цифровые столбцы. Значения года в DF1 не являются уникальными. Я хотел бы нормализовать числовые столбцы DF1 на годовом уровне, используя определенную функцию. Для этого у меня есть еще один...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
21 фев 2025, 23:13
Объединить Dataframe на основе помеченного столбца подстроки, сохраняя при этом исходную метку столбца

Последнее сообщение Anonymous « 01 июл 2024, 21:30
Добавлено в форуме Python

Anonymous » 01 июл 2024, 21:30 » в форуме Python

У меня есть фрейм данных, содержащий столбцы с шаблоном метки (name/startDateTime/endDateTime)
import pandas as pd
pd.DataFrame({
BOJ presser/2024-03-19T07:30:00Z/2024-03-19T10:30:00Z : ,
BOJ/2024-01-23T04:00:00Z/2024-01-23T07:00:00Z : ,...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
01 июл 2024, 21:30

Вернуться в «Python»

Programmiererforum