Можно ли выполнить слияние нечетких совпадений с пандами?Python

Программы на Python
Ответить
Anonymous
 Можно ли выполнить слияние нечетких совпадений с пандами?

Сообщение Anonymous »

У меня есть два DataFrame, которые я хочу объединить на основе столбца. Однако из-за альтернативного написания, разного количества пробелов, отсутствия/наличия диакритических знаков я хотел бы иметь возможность объединяться, если они похожи друг на друга.
Подойдет любой алгоритм сходства (soundex, Levenshtein, difflib's).
Скажем, DataFrames имеет следующие данные:
number
one 1
two 2
three 3
four 4
five 5

letter
one a
too b
three c
fours d
five e

Затем я хочу получить результирующий DataFrame
number letter
one 1 a
two 2 b
three 3 c
four 4 d
five 5 e

Настройка:
df1 = DataFrame({'number': [1, 2, 3, 4, 5]}, index=['one', 'two', 'three', 'four', 'five'])
df2 = DataFrame({'letter': ['a', 'b', 'c', 'd', 'e']}, index=['one', 'too', 'three', 'fours', 'five'])


Подробнее здесь: https://stackoverflow.com/questions/136 ... ith-pandas
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»