Это работает нормально, но для больших наборов данных функции Apply значительно замедляют процесс.
Есть ли более элегантный и быстрый способ сделать это?
У меня есть фрейм данных со строковым представлением json: [code]df = pl.DataFrame({ "json": [ '{"x":[0,1,2,3], "y":[10,20,30,40]}', '{"x":[0,1,2,3], "y":[10,20,30,40]}', '{"x":[0,1,2,3], "y":[10,20,30,40]}' ] }) [/code] [code]shape: (3, 1) ┌───────────────────────────────────┐ │ json │ │ --- │ │ str │ ╞═══════════════════════════════════╡ │ {"x":[0,1,2,3], "y":[10,20,30,40… │ │ {"x":[0,1,2,3], "y":[10,20,30,40… │ │ {"x":[0,1,2,3], "y":[10,20,30,40… │ └───────────────────────────────────┘ [/code] Теперь я хотел бы вычислить [b]среднее[/b] для [b]y[/b], где [b]x > 0[/b] и [b] x dict, а затем создайте фрейм данных, который фильтруется по x. [code]# import ast df = df.with_columns( pl.col('json').map_elements(lambda x: pl.DataFrame(ast.literal_eval(x)).filter((pl.col('x') < 3) & (pl.col('x') > 0))['y'].mean()) ) [/code] [code]shape: (3, 1) ┌──────┐ │ json │ │ --- │ │ f64 │ ╞══════╡ │ 25.0 │ │ 25.0 │ │ 25.0 │ └──────┘ [/code]
Это работает нормально, но для больших наборов данных функции Apply значительно замедляют процесс. Есть ли более элегантный и быстрый способ сделать это?
Мне нужно указать фильтр как:
name=projects//locations//repositories//packages//tags/
Когда я делаю это с ЛЮБЫМ тэгом; даже тот, о существовании которого я знаю, я получаю сообщение об ошибке:
400 неверное имя...
Я использую HealthConnect API для сверки агрегированных данных о калориях с суммированными вручную значениями из отдельных записей. Я реализовал в Котлине функцию, которая извлекает ежедневные записи и агрегированную сумму за каждый день за...
ЭТО НЕ ВОПРОС
У меня долгое время была проблема с преобразованием objectId в строку при весенней агрегации загрузки, и я не могу найти ничего полезного способ ее решения.
Наконец-то я понял и хотел бы поделиться своим способом с теми, у кого такая...
У меня есть очень большое количество файлов данных Parquet, которые я могу легко объединить и агрегировать с помощью Polars, делая что-то вроде этого (обратите внимание на глобус в имени файла):
(
pl.scan_parquet('data/data-16828*.parquet')...
У меня есть списки (штаты) списков (городов) списков (городов). Как мне сгладить средний список (города) и преобразовать его в карту (название штата) карты (название города) списков (городов)?
Этот вопрос может выглядеть аналогично другому вопрос:...