В этом ответе я видел, что могу сделать df['Name'] =df['Name'].str .split(', ').map(lambda x : ' '.join(x[::-1])), чтобы изменить его порядок, но проблема в том, что многие имена поставщиков также имеют , в строке, и это не сработает.
Я нашел библиотеку Stanza, которая может определять, содержит ли строка имя. Вот пример кода:
Код: Выделить всё
import stanza
stanza.download('en')
nlp = stanza.Pipeline('en')
doc = nlp("My name is John Doe.")
doc.ents
[{
"text": "John Doe",
"type": "PERSON",
"start_char": 11,
"end_char": 19
}]
Мой вопрос: как мне проверить каждое значение в имени< столбец /code>, содержащий , и изменить формат имени только для этих людей?
Подробнее здесь: https://stackoverflow.com/questions/791 ... ains-names
Мобильная версия