Как переписать функцию манипулирования строками `map_elements`, используя выражения Polars? - Цифровое Кемерово

Как переписать функцию манипулирования строками `map_elements`, используя выражения Polars? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как переписать функцию манипулирования строками `map_elements`, используя выражения Polars?

Цитата

Сообщение Anonymous » 02 ноя 2025, 13:54

1. Данные
У меня есть следующий кадр данных, созданный в полярах:

Код: Выделить всё

import polars as pl
data = {"name": ['a', 'b'], "value": ['1-a-2-#', '2-b-3-*']}
df = pl.DataFrame(data)
print(df)

Выход:

Код: Выделить всё

shape: (2, 2)
┌──────┬─────────┐
│ name ┆ value   │
│ ---  ┆ ---     │
│ str  ┆ str     │
╞══════╪═════════╡
│ a    ┆ 1-a-2-# │
│ b    ┆ 2-b-3-* │
└──────┴─────────┘

2. Что я хочу сделать
Я хотел бы создать новый столбец с именем value_new, который содержит только первые два «числовых» элемента в столбце value, и они снова будут разделены знаком -.
Я могу сделать это с помощью лямбда-функции, предоставленной методу .map_elements():

Код: Выделить всё

separator = '-'

str_lambda = (lambda name:
name.split(separator)[0]
+ separator
+ name.split(separator)[2]
)

df_1 = df.with_columns(
pl.col('value')
.map_elements(str_lambda)
.alias('value_new')
)

print(df_1)

Выход:

Код: Выделить всё

shape: (2, 3)
┌──────┬─────────┬───────────┐
│ name ┆ value   ┆ value_new │
│ ---  ┆ ---     ┆ ---       │
│ str  ┆ str     ┆ str       │
╞══════╪═════════╪═══════════╡
│ a    ┆ 1-a-2-# ┆ 1-2       │
│ b    ┆ 2-b-3-* ┆ 2-3       │
└──────┴─────────┴───────────┘

3. Мой вопрос:
Как добиться того же, используя выражение поляров?
Я спрашиваю об этом, потому что в документе для Polars.Expr.map_elements есть предупреждение о том, что "Этот метод намного медленнее, чем собственный API выражений".
Итак, я хотел бы знать, как реализовать то же самое с помощью собственные выражения, которые будут идентифицировать и объединять некоторые элементы в столбце типа данных str.
Спасибо.
(То, что я пробовал и чего ожидаю, описано выше.)

Подробнее здесь: https://stackoverflow.com/questions/778 ... ars-expres

1762080860

Anonymous

1. Данные
У меня есть следующий кадр данных, созданный в полярах:
[code]import polars as pl
data = {"name": ['a', 'b'], "value": ['1-a-2-#', '2-b-3-*']}
df = pl.DataFrame(data)
print(df)
[/code]
Выход:
[code]shape: (2, 2)
┌──────┬─────────┐
│ name ┆ value   │
│ ---  ┆ ---     │
│ str  ┆ str     │
╞══════╪═════════╡
│ a    ┆ 1-a-2-# │
│ b    ┆ 2-b-3-* │
└──────┴─────────┘
[/code]
2. Что я хочу сделать
Я хотел бы создать новый столбец с именем value_new, который содержит только первые два «числовых» элемента в столбце value, и они снова будут разделены знаком -.
Я могу сделать это с помощью лямбда-функции, предоставленной методу .map_elements():
[code]separator = '-'

str_lambda = (lambda name:
name.split(separator)[0]
+ separator
+ name.split(separator)[2]
)

df_1 = df.with_columns(
pl.col('value')
.map_elements(str_lambda)
.alias('value_new')
)

print(df_1)
[/code]
Выход:
[code]shape: (2, 3)
┌──────┬─────────┬───────────┐
│ name ┆ value   ┆ value_new │
│ ---  ┆ ---     ┆ ---       │
│ str  ┆ str     ┆ str       │
╞══════╪═════════╪═══════════╡
│ a    ┆ 1-a-2-# ┆ 1-2       │
│ b    ┆ 2-b-3-* ┆ 2-3       │
└──────┴─────────┴───────────┘
[/code]
3. Мой вопрос:
Как добиться того же, используя выражение поляров?
Я спрашиваю об этом, потому что в документе для Polars.Expr.map_elements есть предупреждение о том, что [b]"Этот метод намного медленнее, чем собственный API выражений"[/b].
Итак, я хотел бы знать, как реализовать то же самое с помощью собственные выражения, которые будут идентифицировать и объединять некоторые элементы в столбце типа данных str.
Спасибо.
(То, что я пробовал и чего ожидаю, описано выше.) 

Подробнее здесь: [url]https://stackoverflow.com/questions/77826482/how-to-rewrite-a-map-elements-string-manipulation-function-using-polars-expres[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»