У меня есть очень большой набор данных со столбцом «Имя», который состоит из имен поставщиков, смешанных с именами сотрудников (в формате «Фамилия», «Имя» или, реже «Фамилия, имя и начальная буква имени»). В Pandas я пробовал разделить , и изменить порядок на Имя Фамилия, но было много поставщиков, которые также соответствовали этой проверке (например, Fake Company, LLC или example, Inc). Их было слишком много, чтобы их можно было просмотреть и создать список игнорирования.
Есть ли какая-нибудь библиотека/инструмент, который может лучше определить, является ли значение именем? Ничего страшного, если не будет 100% точности.
Подробнее здесь: https://stackoverflow.com/questions/791 ... xed-column
Преобразование «Фамилия, Имя» в «Имя Фамилия» в смешанном столбце ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение