Очистить серию панд с помощью регулярного выражения

Очистить серию панд с помощью регулярного выражения ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Очистить серию панд с помощью регулярного выражения

Цитата

Сообщение Anonymous » 03 дек 2024, 19:39

Я пытаюсь очистить столбец с именем «исторический_ранг» в кадре данных pandas. Он содержит строковые данные. Вот образец содержания:

Код: Выделить всё

       historical_rank
...    ...
122    1908
123    O'
124
125    1911
126    1912
127    1913 * * * 2010 * * *
128
129    1914
130    1915
131
132
133    1918
134    (First served 1989 to 1999)
...    ...

Данные, которые я хочу сохранить, — это четырехзначные числа в строках 122, 125, 126, 127, 129, 130 и 133. В других частях серии это число (исторический ранг) может быть одно-, двух- или трехзначным. Он всегда начинает строку, и после него всегда идет пробел. Я хочу использовать регулярное выражение, чтобы сохранить желаемый шаблон — r'\d{1,4}(?=\s)' — и удалить все остальное в серии. Каков правильный код для достижения этой цели? Спасибо.

Подробнее здесь: https://stackoverflow.com/questions/620 ... sing-regex

1733243971

Anonymous

Я пытаюсь очистить столбец с именем «исторический_ранг» в кадре данных pandas. Он содержит строковые данные. Вот образец содержания:

[code]       historical_rank
...    ...
122    1908
123    O'
124
125    1911
126    1912
127    1913 * * * 2010 * * *
128
129    1914
130    1915
131
132
133    1918
134    (First served 1989 to 1999)
...    ...
[/code]

Данные, которые я хочу сохранить, — это четырехзначные числа в строках 122, 125, 126, 127, 129, 130 и 133. В других частях серии это число (исторический ранг) может быть одно-, двух- или трехзначным. Он всегда начинает строку, и после него всегда идет пробел. Я хочу использовать регулярное выражение, чтобы сохранить желаемый шаблон — r'\d{1,4}(?=\s)' — и удалить все остальное в серии. Каков правильный код для достижения этой цели? Спасибо.   

Подробнее здесь: [url]https://stackoverflow.com/questions/62010292/clean-pandas-series-using-regex[/url]