Очистить серию панд с помощью регулярного выраженияPython

Программы на Python
Ответить
Anonymous
 Очистить серию панд с помощью регулярного выражения

Сообщение Anonymous »

Я пытаюсь очистить столбец с именем «исторический_ранг» в кадре данных pandas. Он содержит строковые данные. Вот образец содержания:

Код: Выделить всё

       historical_rank
...    ...
122    1908
123    O'
124
125    1911
126    1912
127    1913 * * * 2010 * * *
128
129    1914
130    1915
131
132
133    1918
134    (First served 1989 to 1999)
...    ...
Данные, которые я хочу сохранить, — это четырехзначные числа в строках 122, 125, 126, 127, 129, 130 и 133. В других частях серии это число (исторический ранг) может быть одно-, двух- или трехзначным. Он всегда начинает строку, и после него всегда идет пробел. Я хочу использовать регулярное выражение, чтобы сохранить желаемый шаблон — r'\d{1,4}(?=\s)' — и удалить все остальное в серии. Каков правильный код для достижения этой цели? Спасибо.

Подробнее здесь: https://stackoverflow.com/questions/620 ... sing-regex
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»