Как я могу уменьшить объем данных в Polars DataFrame?Python

Программы на Python
Ответить
Anonymous
 Как я могу уменьшить объем данных в Polars DataFrame?

Сообщение Anonymous »

У меня есть файл csv размером 28 ГБ, который я хочу построить. Очевидно, что это слишком много точек данных, так как я могу уменьшить данные? Я хотел бы объединить около 1000 точек данных в одну, вычислив среднее значение. Вот структура моего DataFrame:

Код: Выделить всё

import polars as pl

df = pl.from_repr("""
┌─────────────────┬────────────┐
│ Time in seconds ┆ Force in N │
│ ---             ┆ ---        │
│ f64             ┆ f64        │
╞═════════════════╪════════════╡
│ 0.0             ┆ 2310.18    │
│ 0.0005          ┆ 2313.23    │
│ 0.001           ┆ 2314.14    │
└─────────────────┴────────────┘
""")
Я думал об использовании group_by_dynamic, а затем вычислении среднего значения каждой группы, но, похоже, это работает только при использовании даты и времени? Однако время в секундах указывается как число с плавающей запятой.


Подробнее здесь: https://stackoverflow.com/questions/769 ... -dataframe
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»