Извлеките определенное слово (без учета регистра), за которым следуют цифры из Pandas df.Python

Программы на Python
Ответить
Anonymous
 Извлеките определенное слово (без учета регистра), за которым следуют цифры из Pandas df.

Сообщение Anonymous »

Можете ли вы извлечь ряд букв и цифр из плохих данных произвольной формы в фрейме данных?
Я хочу создать новый столбец в фрейме данных с данными, содержащими «NEX» и после него ряд цифр.
import pandas as pd

#Create a Dataframe
data = {
'ID':[1,2,3,4,5],
'PROGRAM': [ 'nbu 123456',
'NBU-123456',
'nex999999 b12',
'NXE999999 123',
'NBU123456 NEX999999']
}

df = pd.DataFrame(data)

Я думаю, что я прав в отношении приведенного ниже, но мне как-то нужно объединить их функциональность: -
print(df['PROGRAM'].str.contains('NEX', na=False))
# does not deal with lower case & contains letters NEX not nessary in that order
print(df['PROGRAM'].str.extract(r'([NEX]+\d+)', expand=False))

Результат должен возвращать только NEX999999 (включая преобразование нижнего регистра в верхний регистр)
df['NEX'] = df['PROGRAM'].str.blahblahblah


Подробнее здесь: https://stackoverflow.com/questions/791 ... -pandas-df
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»