Можете ли вы извлечь ряд букв и цифр из плохих данных произвольной формы в фрейме данных?
Я хочу создать новый столбец в фрейме данных с данными, содержащими «NEX» и после него ряд цифр.
import pandas as pd
#Create a Dataframe
data = {
'ID':[1,2,3,4,5],
'PROGRAM': [ 'nbu 123456',
'NBU-123456',
'nex999999 b12',
'NXE999999 123',
'NBU123456 NEX999999']
}
df = pd.DataFrame(data)
Я думаю, что я прав в отношении приведенного ниже, но мне как-то нужно объединить их функциональность: -
print(df['PROGRAM'].str.contains('NEX', na=False))
# does not deal with lower case & contains letters NEX not nessary in that order
print(df['PROGRAM'].str.extract(r'([NEX]+\d+)', expand=False))
Результат должен возвращать только NEX999999 (включая преобразование нижнего регистра в верхний регистр)
df['NEX'] = df['PROGRAM'].str.blahblahblah
Подробнее здесь: https://stackoverflow.com/questions/791 ... -pandas-df
Извлеките определенное слово (без учета регистра), за которым следуют цифры из Pandas df. ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Python, извлеките URL-адреса из карты сайта xml, содержащие определенное слово
Anonymous » » в форуме Python - 0 Ответы
- 10 Просмотры
-
Последнее сообщение Anonymous
-