Как использовать Pandera для перекрестной проверки, присутствуют ли некоторые подстроки в одном столбце в другом столбцеPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как использовать Pandera для перекрестной проверки, присутствуют ли некоторые подстроки в одном столбце в другом столбце

Сообщение Anonymous »

У меня есть такая схема DataFrameSchema Pandas:

Код: Выделить всё

Schema = DataFrameSchema(
columns={
'Complete_Name': Column(name='Complete_Name', dtype='string', nullable=True),
'Surname': Column(name='Surname', dtype='string', nullable=True),
},
checks=check_cross_check_name_and_surname,
coerce=True,
strict=True,
ordered=False,
unique_column_names=True,
metadata=None
)
Проверка должна работать как этот SQL-запрос (с каждым полным именем должна быть связана фамилия):

Код: Выделить всё

SELECT * FROM database.user
WHERE Complete_Name LIKE '%'||Surname||'%'
Я пробовал такие вещи, как

Код: Выделить всё

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Complete_Name"].str.contains(df["Surname"], regex=True), element_wise=True, ignore_na=False)]

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Complete_Name"].str.contains(df["Surname"], regex=False), element_wise=True, ignore_na=False)]

check_cross_check_name_and_surname = [pa.Check(lambda df: df["Surname"] in df["Complete_Name"], element_wise=True, ignore_na=False)]
Что мне нужно написать, чтобы убедиться, что мои тесты выполняются правильно при вызове Schema.validate(dataframe)?

Подробнее здесь: https://stackoverflow.com/questions/789 ... -present-i
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»