Можно ли выполнить слияние нечетких совпадений с пандами Python?Python

Программы на Python
Ответить
Anonymous
 Можно ли выполнить слияние нечетких совпадений с пандами Python?

Сообщение Anonymous »

У меня есть два DataFrame, которые я хочу объединить на основе столбца. Однако из-за альтернативного написания, разного количества пробелов, отсутствия/наличия диакритических знаков хотелось бы иметь возможность объединять, если они похожи друг на друга.

Подойдет любой алгоритм сходства (soundex, Levenshtein, difflib's).

Предположим, один DataFrame содержит следующие данные:

df1 = DataFrame([[1],[2],[3],[4],[5]], index=['one','two','three','four','five'], columns=['number'])

number
one 1
two 2
three 3
four 4
five 5

df2 = DataFrame([['a'],['b'],['c'],['d'],['e']], index=['one','too','three','fours','five'], columns=['letter'])

letter
one a
too b
three c
fours d
five e


Затем я хочу получить результирующий DataFrame

number letter
one 1 a
two 2 b
three 3 c
four 4 d
five 5 e


Подробнее здесь: https://stackoverflow.com/questions/136 ... hon-pandas
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»