Как я могу проверить, имеют ли два столбца одинаковый текст в pyspark?Python

Программы на Python
Ответить
Anonymous
 Как я могу проверить, имеют ли два столбца одинаковый текст в pyspark?

Сообщение Anonymous »

По сути, я собираю данные из двух таблиц и сравниваю их. Некоторые данные поступают из старой таблицы, а другие — из новой таблицы. Краткий пример можно увидеть ниже:




product_id
old_category
new_category




001
Металлические отходы
Металлические детали


002
Автомобильные запчасти
Автомобильные детали


003
Пластиковое крыло
Fender




Есть ли способ сравнить столбцы old_category и new_category, чтобы проверить, насколько они похожи?
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»