По сути, я пытаюсь воспроизвести следующий SQL, если бы я мог выполнить расстояние Левенштейна в SQL:
Код: Выделить всё
SELECT
*
FROM dataset_a a
JOIN dataset_b b on Levenshtein(a.firstname,b.firstname)
Подробнее здесь: [url]https://stackoverflow.com/questions/32250200/how-can-i-merge-two-pandas-dataframes-based-on-a-function-instead-of-just-where[/url]