Поляры — преобразование строки в число с плавающей запятой с условным множителем в зависимости от суффикса строки.Python

Программы на Python
Ответить
Anonymous
 Поляры — преобразование строки в число с плавающей запятой с условным множителем в зависимости от суффикса строки.

Сообщение Anonymous »

Я хочу изменить строковый столбец на столбец с плавающей запятой. Он состоит из объема с буквами «к» и «мм», что означает тысячу и миллион соответственно. Моя цель — обменять их все на миллионы и отправить в плавающий режим
import polars as pl

df = pl.DataFrame({"col1": ["a", "b", "c", "d", "e", "f", "g", "h", "i", "j"],
"col2": ["500K", "1MM", "25K", "2.5MM", "2MM", "600K", "800K", "1.5MM", "5MM", "350k"]})

df.with_columns(
pl.when(
pl.col("col2").str.contains("MM$"))
.then(pl.col("col2")
.str.replace("MM$", "")
.str.strip_chars())
.otherwise(pl.col("col2")
.str.replace("K$", "")
.str.strip_chars()
.cast(pl.Float32)/1000)
)

Последняя строка .cast(pl.Float32)/1000 не работает.
# InvalidOperationError: conversion from `str` to `f32` failed in column 'col2' for 6 out of 10 values: ["1MM", "2.5MM", … "350k"]

Я знаю другое решение, но мне придется прочитать столбец фрейма данных дважды. Я стремлюсь к решению, которое читается только один раз. Спасибо
Вот ожидаемый результат моего тестового примера:
shape: (10, 2)
┌──────┬───────┐
│ col1 ┆ col2 │
│ --- ┆ --- │
│ str ┆ f32 │
╞══════╪═══════╡
│ a ┆ 0.5 │
│ b ┆ 1.0 │
│ c ┆ 0.025 │
│ d ┆ 2.5 │
│ e ┆ 2.0 │
│ f ┆ 0.6 │
│ g ┆ 0.8 │
│ h ┆ 1.5 │
│ i ┆ 5.0 │
│ j ┆ 0.35 │
└──────┴───────┘


Подробнее здесь: https://stackoverflow.com/questions/757 ... -on-string
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»