Pandas извлекает цифры после определенной строкиPython

Программы на Python
Ответить
Anonymous
 Pandas извлекает цифры после определенной строки

Сообщение Anonymous »

Я очищаю некачественный текст произвольной формы в файле CSV.
Можете ли вы извлечь первую серию числовых цифр после слова «НБУ». У меня проблемы с пробелами или специальными символами после «NBU». Ниже приведен пример df:-

Код: Выделить всё

import pandas as pd
import re

#Create a Dataframe
data = {
'ID':[1,2,3,4,5],
'PROGRAM': ['nbu 123456',
'NBU-123456',
'nub999999 NBU123456',
'NBU123456 123',
'NBU123456 NEX999999']
Результат для приведенного выше значения должен быть «123456».

Код: Выделить всё

df['NBU'] = df['PROGRAM'].str.extract(r'nbu(\d+)', expand=False, flags=re.I)
Вышеуказанное близко, но не учитывает пробелы и специальные символы.

Подробнее здесь: https://stackoverflow.com/questions/791 ... ned-string
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»