Я пытаюсь очистить столбец с именем «исторический_ранг» в кадре данных pandas. Он содержит строковые данные. Вот образец содержания:
Код: Выделить всё
historical_rank
... ...
122 1908
123 O'
124
125 1911
126 1912
127 1913 * * * 2010 * * *
128
129 1914
130 1915
131
132
133 1918
134 (First served 1989 to 1999)
... ...
Данные, которые я хочу сохранить, — это четырехзначные числа в строках 122, 125, 126, 127, 129, 130 и 133. В других частях серии это число (исторический ранг) может быть одно-, двух- или трехзначным. Он всегда начинает строку, и после него всегда идет пробел. Я хочу использовать регулярное выражение, чтобы сохранить желаемый шаблон — r'\d{1,4}(?=\s)' — и удалить все остальное в серии. Каков правильный код для достижения этой цели? Спасибо.
Подробнее здесь:
https://stackoverflow.com/questions/620 ... sing-regex