Pandas обнаруживает, содержит ли значение серии именаPython

Программы на Python
Ответить
Anonymous
 Pandas обнаруживает, содержит ли значение серии имена

Сообщение Anonymous »

У меня большой набор данных (~ 150 000 строк), и один из столбцов Имя содержит имена поставщиков, смешанные с отдельными именами (в формате Фамилия, Имя). Я пытаюсь изменить порядок только отдельных имен в формате имени и фамилии.
В этом ответе я видел, что могу сделать df['Name'] =df['Name'].str .split(', ').map(lambda x : ' '.join(x[::-1])), чтобы изменить его порядок, но проблема в том, что многие имена поставщиков также имеют , в строке, и это не сработает.
Я нашел библиотеку Stanza, которая может определять, содержит ли строка имя. Вот пример кода:

Код: Выделить всё

import stanza
stanza.download('en')
nlp = stanza.Pipeline('en')
doc = nlp("My name is John Doe.")
doc.ents
[{
"text": "John Doe",
"type": "PERSON",
"start_char": 11,
"end_char": 19
}]
Я просто собирался получить доступ к doc.ents[0]['type']
Мой вопрос: как мне проверить каждое значение в имени< столбец /code>, содержащий , и изменить формат имени только для этих людей?

Подробнее здесь: https://stackoverflow.com/questions/791 ... ains-names
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»