Скользящая сумма с интервалом справа в DuckDB

Скользящая сумма с интервалом справа в DuckDB ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Скользящая сумма с интервалом справа в DuckDB

Цитата

Сообщение Anonymous » 17 окт 2024, 12:58

В Polars/Pandas я могу сделать скользящую сумму, где каждая строка соответствует окну (строка – 10 минут, строка]. Например:

Код: Выделить всё

import polars as pl

data = {
"timestamp": [
"2023-08-04 10:00:00",
"2023-08-04 10:05:00",
"2023-08-04 10:10:00",
"2023-08-04 10:10:00",
"2023-08-04 10:20:00",
"2023-08-04 10:20:00",
],
"value": [1, 2, 3, 4, 5, 6],
}

df = pl.DataFrame(data).with_columns(pl.col("timestamp").str.strptime(pl.Datetime))

print(
df.with_columns(pl.col("value").rolling_sum_by("timestamp", "10m", closed="right"))
)

Это выводит

Код: Выделить всё

shape: (6, 2)
┌─────────────────────┬───────┐
│ timestamp           ┆ value │
│ ---                 ┆ ---   │
│ datetime[μs]        ┆ i64   │
╞═════════════════════╪═══════╡
│ 2023-08-04 10:00:00 ┆ 1     │
│ 2023-08-04 10:05:00 ┆ 3     │
│ 2023-08-04 10:10:00 ┆ 9     │
│ 2023-08-04 10:10:00 ┆ 9     │
│ 2023-08-04 10:20:00 ┆ 11    │
│ 2023-08-04 10:20:00 ┆ 11    │
└─────────────────────┴───────┘

Как это сделать в DuckDB? Самое близкое, что я смог придумать, это:

Код: Выделить всё

rel = duckdb.sql("""
SELECT
timestamp,
value,
SUM(value) OVER roll AS rolling_sum
FROM df
WINDOW roll AS (
ORDER BY timestamp
RANGE BETWEEN INTERVAL 10 minutes PRECEDING AND CURRENT ROW
)
ORDER BY timestamp;
""")
print(rel)

но это делает окно [строка – 10 минут, строка], а не (строка – 10 минут, строка]
В качестве альтернативы я мог бы сделать

Код: Выделить всё

rel = duckdb.sql("""
SELECT
timestamp,
value,
SUM(value) OVER roll AS rolling_sum
FROM df
WINDOW roll AS (
ORDER BY timestamp
RANGE BETWEEN INTERVAL '10 minutes' - INTERVAL '1 microsecond' PRECEDING AND CURRENT ROW
)
ORDER BY timestamp;
""")

но я не уверен, насколько это будет надежно?

Подробнее здесь: https://stackoverflow.com/questions/790 ... -in-duckdb

1729159086

Anonymous

В Polars/Pandas я могу сделать скользящую сумму, где каждая строка соответствует окну (строка – 10 минут, строка]. Например:
[code]import polars as pl

data = {
"timestamp": [
"2023-08-04 10:00:00",
"2023-08-04 10:05:00",
"2023-08-04 10:10:00",
"2023-08-04 10:10:00",
"2023-08-04 10:20:00",
"2023-08-04 10:20:00",
],
"value": [1, 2, 3, 4, 5, 6],
}

df = pl.DataFrame(data).with_columns(pl.col("timestamp").str.strptime(pl.Datetime))

print(
df.with_columns(pl.col("value").rolling_sum_by("timestamp", "10m", closed="right"))
)
[/code]
Это выводит
[code]shape: (6, 2)
┌─────────────────────┬───────┐
│ timestamp           ┆ value │
│ ---                 ┆ ---   │
│ datetime[μs]        ┆ i64   │
╞═════════════════════╪═══════╡
│ 2023-08-04 10:00:00 ┆ 1     │
│ 2023-08-04 10:05:00 ┆ 3     │
│ 2023-08-04 10:10:00 ┆ 9     │
│ 2023-08-04 10:10:00 ┆ 9     │
│ 2023-08-04 10:20:00 ┆ 11    │
│ 2023-08-04 10:20:00 ┆ 11    │
└─────────────────────┴───────┘
[/code]
Как это сделать в DuckDB? Самое близкое, что я смог придумать, это:
[code]rel = duckdb.sql("""
SELECT
timestamp,
value,
SUM(value) OVER roll AS rolling_sum
FROM df
WINDOW roll AS (
ORDER BY timestamp
RANGE BETWEEN INTERVAL 10 minutes PRECEDING AND CURRENT ROW
)
ORDER BY timestamp;
""")
print(rel)
[/code]
но это делает окно [строка – 10 минут, строка], а не (строка – 10 минут, строка]
В качестве альтернативы я мог бы сделать
[code]rel = duckdb.sql("""
SELECT
timestamp,
value,
SUM(value) OVER roll AS rolling_sum
FROM df
WINDOW roll AS (
ORDER BY timestamp
RANGE BETWEEN INTERVAL '10 minutes' - INTERVAL '1 microsecond' PRECEDING AND CURRENT ROW
)
ORDER BY timestamp;
""")
[/code]
но я не уверен, насколько это будет надежно?
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79097421/rolling-sum-with-right-closed-interval-in-duckdb[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Скользящая сумма с интервалом справа в DuckDB

Последнее сообщение Anonymous « 17 окт 2024, 14:23
Добавлено в форуме Python

Anonymous » 17 окт 2024, 14:23 » в форуме Python

В Polars/Pandas я могу сделать скользящую сумму, где каждая строка соответствует окну (строка – 10 минут, строка]. Например:
import polars as pl

data = {
timestamp : ,
value : ,
}

df = pl.DataFrame(data).with_columns(pl.col( timestamp...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 14:23
Скользящая сумма с интервалом справа в DuckDB

Последнее сообщение Anonymous « 17 окт 2024, 18:33
Добавлено в форуме Python

Anonymous » 17 окт 2024, 18:33 » в форуме Python

В Polars/Pandas я могу сделать скользящую сумму, где каждая строка соответствует окну (строка – 10 минут, строка]. Например:
import polars as pl

data = {
timestamp : ,
value : ,
}

df = pl.DataFrame(data).with_columns(pl.col( timestamp...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 18:33
Скользящая сумма с использованием реляционного API Python DuckDB

Последнее сообщение Anonymous « 10 ноя 2024, 22:08
Добавлено в форуме Python

Anonymous » 10 ноя 2024, 22:08 » в форуме Python

Скажем, у меня есть
data = {'id': ,
'd': ,
'sales': }

Я хочу вычислить скользящую сумму с окном из 2, разделенным по «id», упорядоченным по «d».
С помощью SQL я могу это сделать:
duckdb.sql(
select *, sum(sales) over w as rolling_sales
from...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
10 ноя 2024, 22:08
Скользящая сумма с использованием реляционного API Python DuckDB

Последнее сообщение Anonymous « 11 ноя 2024, 10:31
Добавлено в форуме Python

Anonymous » 11 ноя 2024, 10:31 » в форуме Python

Скажем, у меня есть
data = {'id': ,
'd': ,
'sales': }

Я хочу вычислить скользящую сумму с окном из 2, разделенным по «id», упорядоченным по «d».
С помощью SQL я могу это сделать:
duckdb.sql(
select *, sum(sales) over w as rolling_sales
from...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
11 ноя 2024, 10:31
Скользящая сумма, которая сбрасывается по флагу

Последнее сообщение Anonymous « 04 янв 2025, 13:11
Добавлено в форуме MySql

Anonymous » 04 янв 2025, 13:11 » в форуме MySql

Я пытаюсь суммировать значения в таблице, а затем сбросить сумму на границе.
Итак, учитывая такую таблицу

id
значение
flag

1
23
1

2
10
1

3
15
0

4
18
0

5
11
0

6
1
1

7
14
1

8
16
1

Я бы хотел, чтобы сумма сбрасывалась всякий...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
04 янв 2025, 13:11

Вернуться в «Python»