Работа с фреймом данных pandas, попытка очистить столбец от $12 342 до 12342 и преобразовать столбец в число int или число с плавающей запятой. Однако я нашел одну строку с 736[4], поэтому мне пришлось удалить все, что находится в квадратных скобках, включая скобки.
Код на данный момент
Код: Выделить всё
df2['Average Monthly Wage $'] = df2['Average Monthly Wage $'].str.replace('$','')
df2['Average Monthly Wage $'] = df2['Average Monthly Wage $'].str.replace(',','')
df2['Average Monthly Wage $'] = df2['Average Monthly Wage $'].str.replace(' ','')
Строка ниже предназначена для обработки и удаления квадратных скобок, а также намеренно с ее содержимым.
Код: Выделить всё
df2['Average Monthly Wage $'] = df2['Average Monthly Wage $'].str.replace(r'[[^]]*\)','')
Для некоторых разработчиков это тривиально, но я на самом деле не использовал регулярные выражения достаточно часто, чтобы это знать, и я также проверил и на основе одного такого примера стека сформулировал выше.
Подробнее здесь:
https://stackoverflow.com/questions/513 ... ckets-in-s