Как использовать Pandera для перекрестной проверки, присутствуют ли некоторые подстроки в одном столбце в другом столбце

Как использовать Pandera для перекрестной проверки, присутствуют ли некоторые подстроки в одном столбце в другом столбце ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как использовать Pandera для перекрестной проверки, присутствуют ли некоторые подстроки в одном столбце в другом столбце

Цитата

Сообщение Anonymous » 17 сен 2024, 17:48

У меня есть такая схема DataFrameSchema Pandas:

Код: Выделить всё

Schema = DataFrameSchema(
columns={
'Complete_Name': Column(name='Complete_Name', dtype='string', nullable=True),
'Surname': Column(name='Surname', dtype='string', nullable=True),
},
checks=check_cross_check_name_and_surname,
coerce=True,
strict=True,
ordered=False,
unique_column_names=True,
metadata=None
)

Проверка должна работать как этот SQL-запрос (с каждым полным именем должна быть связана фамилия):

Код: Выделить всё

SELECT * FROM database.user
WHERE Complete_Name LIKE '%'||Surname||'%'

Я пробовал такие вещи, как

Код: Выделить всё

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Complete_Name"].str.contains(df["Surname"], regex=True), element_wise=True, ignore_na=False)]

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Complete_Name"].str.contains(df["Surname"], regex=False), element_wise=True, ignore_na=False)]

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Surname"] in df["Complete_Name"], element_wise=True, ignore_na=False)]

Что мне нужно написать, чтобы убедиться, что мои тесты выполняются правильно при вызове Schema.validate(dataframe)?

Подробнее здесь: https://stackoverflow.com/questions/789 ... -present-i

1726584535

Anonymous

У меня есть такая схема DataFrameSchema Pandas:
[code]Schema = DataFrameSchema(
columns={
'Complete_Name': Column(name='Complete_Name', dtype='string', nullable=True),
'Surname': Column(name='Surname', dtype='string', nullable=True),
},
checks=check_cross_check_name_and_surname,
coerce=True,
strict=True,
ordered=False,
unique_column_names=True,
metadata=None
)
[/code]
Проверка должна работать как этот SQL-запрос (с каждым полным именем должна быть связана фамилия):
[code]SELECT * FROM database.user
WHERE Complete_Name LIKE '%'||Surname||'%'
[/code]
Я пробовал такие вещи, как
[code]check_cross_check_name_and_surname = [pa.Check(lambda df: df["Complete_Name"].str.contains(df["Surname"], regex=True), element_wise=True, ignore_na=False)]

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Complete_Name"].str.contains(df["Surname"], regex=False), element_wise=True, ignore_na=False)]

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Surname"] in df["Complete_Name"], element_wise=True, ignore_na=False)]
[/code]
Что мне нужно написать, чтобы убедиться, что мои тесты выполняются правильно при вызове Schema.validate(dataframe)? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78994585/how-to-use-pandera-to-cross-check-if-some-substrings-in-one-column-are-present-i[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как проверить, присутствуют ли все элементы в списке в одном столбце панд в другом столбце панд

Последнее сообщение Anonymous « 09 ноя 2024, 01:13
Добавлено в форуме Python

Anonymous » 09 ноя 2024, 01:13 » в форуме Python

У меня есть списки в одном столбце кадра данных df1, и я хочу для каждой строки проверить, находятся ли все элементы этого списка в другом столбце, который находится во втором кадре данных df2 .

Два фрейма данных выглядят примерно так:

df1 df2...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
09 ноя 2024, 01:13
Как проверить, присутствуют ли все элементы в списке в одном столбце панд в другом столбце панд

Последнее сообщение Anonymous « 09 ноя 2024, 01:19
Добавлено в форуме Python

Anonymous » 09 ноя 2024, 01:19 » в форуме Python

У меня есть списки в одном столбце кадра данных df1, и я хочу для каждой строки проверить, находятся ли все элементы этого списка в другом столбце, который находится во втором кадре данных df2 .

Два фрейма данных выглядят примерно так:

df1 df2...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
09 ноя 2024, 01:19
Есть ли способ сгруппировать данные по значению в одном столбце, чтобы получить сумму содержимого в другом столбце в пан

Последнее сообщение Anonymous « 29 июл 2024, 16:45
Добавлено в форуме Python

Anonymous » 29 июл 2024, 16:45 » в форуме Python

Извините, если это повторяется, я не могу найти ничего, что дало бы мне ответ...
У меня есть кадр данных, содержащий значения пикселей и количество пикселей этой ценности. Выглядит это примерно так:
Value Count
0.1457 900
0.1458 1800
0.1459 900...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
29 июл 2024, 16:45
Изменить значения в одном столбце на основе значений в другом столбце

Последнее сообщение Anonymous « 05 май 2025, 20:00
Добавлено в форуме Python

Anonymous » 05 май 2025, 20:00 » в форуме Python

Я пытаюсь воспроизвести свой код Stata в Python, и я был указан в направлении Pandas. Однако я испытываю трудности, когда я обернул голову вокруг, как обрабатывать данные. Если этот идентификатор соответствует определенному числу, то я хочу изменить...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
05 май 2025, 20:00
Изменить значения в одном столбце на основе значений в другом столбце

Последнее сообщение Anonymous « 08 май 2025, 06:53
Добавлено в форуме Python

Anonymous » 08 май 2025, 06:53 » в форуме Python

Я пытаюсь воспроизвести свой код Stata в Python, и я был указан в направлении Pandas. Однако я испытываю трудности, когда я обернул голову вокруг, как обрабатывать данные. Если этот идентификатор соответствует определенному числу, то я хочу изменить...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
08 май 2025, 06:53

Вернуться в «Python»