Получите минимум за счет итераций записи в кадре данных pandas

Получите минимум за счет итераций записи в кадре данных pandas ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Получите минимум за счет итераций записи в кадре данных pandas

Цитата

Сообщение Anonymous » 23 июн 2024, 17:50

Я создал следующий фрейм данных pandas:

Код: Выделить всё

import pandas as pd
import numpy as np

ds = { 'trend' : [1,1,1,1,2,2,3,3,3,3,3,3,4,4,4,4,4], 'price' : [23,43,56,21,43,55,54,32,9,12,11,12,23,3,2,1,1]}

df = pd.DataFrame(data=ds)

Кадр данных выглядит следующим образом:

Код: Выделить всё

display(df)

trend   price
0      1     23
1      1     43
2      1     56
3      1     21
4      2     43
5      2     55
6      3     54
7      3     32
8      3     9
9      3     12
10     3     11
11     3     12
12     4     23
13     4     3
14     4     2
15     4     1
16     4     1

Я сохранил фрейм данных в файл .csv с именем df.csv:

Код: Выделить всё

df.to_csv("df.csv", index = False)

Мне нужно создать новое поле с именем «минимум», которое:

обходит каждую запись кадра данных
берёт минимум между ценой, наблюдаемой на каждой итерации, и последней ценой, наблюдаемой в предыдущем тренде.

Например:

Я повторяю запись 0, а минимальная цена равна 23 (есть только этот).
Я перебираю запись 1 и беру минимум между 43 и 23: результат — 23.

Перенесемся к записи 4.

Мне нужно вычислить минимум между ценой, наблюдаемой в записи 4 (
Код: Выделить всё
```
price: 43
```
) и последняя цена, наблюдаемая для предыдущего тренда (
Код: Выделить всё
```
price: 21). Результат: 21.
[/list]
Перенесемся к записи 14.
[list]
[*]Мне нужно чтобы вычислить минимум между ценой
```
, наблюдаемой в записи 14 (
Код: Выделить всё
```
price: 2
```
) и последняя цена, наблюдаемая для предыдущего тренда (
Код: Выделить всё
```
price: 12). Результат — 2.
[/list]
И так далее.
Затем я написал такой код:
minimum = []

for i in range(len(df)):
ds = pd.read_csv("df.csv", nrows=i+1)
d = ds.groupby('trend', as_index=False).agg(
{'price':'last'})

d['minimum'] = d['price'].min()
minimum.append(d['minimum'].iloc[-1])

ds['minimum'] = minimum
```
Результирующий фрейм данных выглядит следующим образом:
display(ds)
Код: Выделить всё
```
        trend   price   minimum
0          1     23         23
1          1     43         43
2          1     56         56
3          1     21         21
4          2     43         21
5          2     55         21
6          3     54         21
7          3     32         21
8          3      9          9
9          3     12         12
10         3     11         11
11         3     12         12
12         4     23         12
13         4      3          3
14         4      2          2
15         4      1          1
16         4      1          1
```
Полученный фрейм данных правильный.
Проблема в том, что мне нужно применить этот процесс к фрейму данных, который содержит около 1 миллиона записей, и он будет на это уйдет около 48 лет.
Кто-нибудь знает более быстрый способ получить те же результаты, что и выше?

Подробнее здесь: https://stackoverflow.com/questions/786 ... -dataframe

1719154224

Anonymous

Я создал следующий фрейм данных pandas:
[code]import pandas as pd
import numpy as np

ds = { 'trend' : [1,1,1,1,2,2,3,3,3,3,3,3,4,4,4,4,4], 'price' : [23,43,56,21,43,55,54,32,9,12,11,12,23,3,2,1,1]}

df = pd.DataFrame(data=ds)
[/code]
Кадр данных выглядит следующим образом:
[code]display(df)

trend   price
0      1     23
1      1     43
2      1     56
3      1     21
4      2     43
5      2     55
6      3     54
7      3     32
8      3     9
9      3     12
10     3     11
11     3     12
12     4     23
13     4     3
14     4     2
15     4     1
16     4     1
[/code]
Я сохранил фрейм данных в файл .csv с именем df.csv:
[code]df.to_csv("df.csv", index = False)
[/code]
Мне нужно создать новое поле с именем «минимум», которое:
[list]
[*]обходит каждую запись кадра данных
[*]берёт минимум между ценой, наблюдаемой на каждой итерации, и последней ценой, наблюдаемой в предыдущем тренде.
[/list]
Например:
[list]
[*]Я повторяю запись 0, а минимальная цена равна 23 (есть только этот).
[*]Я перебираю запись 1 и беру минимум между 43 и 23: результат — 23.
[/list]
Перенесемся к записи 4.
[list]
[*]Мне нужно вычислить минимум между ценой, наблюдаемой в записи 4 ([code]price: 43[/code]) и последняя цена, наблюдаемая для предыдущего тренда ([code]price: 21). Результат: 21.
[/list]
Перенесемся к записи 14.
[list]
[*]Мне нужно чтобы вычислить минимум между ценой[/code], наблюдаемой в записи 14 ([code]price: 2[/code]) и последняя цена, наблюдаемая для предыдущего тренда ([code]price: 12). Результат — 2.
[/list]
И так далее.
Затем я написал такой код:
minimum = []

for i in range(len(df)):
ds = pd.read_csv("df.csv", nrows=i+1)
d = ds.groupby('trend', as_index=False).agg(
{'price':'last'})

d['minimum'] = d['price'].min()
minimum.append(d['minimum'].iloc[-1])

ds['minimum'] = minimum
[/code]
Результирующий фрейм данных выглядит следующим образом:
display(ds)
[code]        trend   price   minimum
0          1     23         23
1          1     43         43
2          1     56         56
3          1     21         21
4          2     43         21
5          2     55         21
6          3     54         21
7          3     32         21
8          3      9          9
9          3     12         12
10         3     11         11
11         3     12         12
12         4     23         12
13         4      3          3
14         4      2          2
15         4      1          1
16         4      1          1
[/code]
Полученный фрейм данных правильный.
Проблема в том, что мне нужно применить этот процесс к фрейму данных, который содержит около 1 миллиона записей, и он будет на это уйдет около 48 лет.
Кто-нибудь знает более быстрый способ получить те же результаты, что и выше? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78659009/get-minimum-through-record-iterations-in-pandas-dataframe[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как рассчитать индекс относительной силы (RSI) с помощью итераций записи в кадре данных pandas

Последнее сообщение Anonymous « 24 июл 2024, 18:04
Добавлено в форуме Python

Anonymous » 24 июл 2024, 18:04 » в форуме Python

Я создал кадр данных pandas следующим образом:
import pandas as pd
import numpy as np

ds = { 'trend' : , 'price' : }

df = pd.DataFrame(data=ds)

Кадр данных выглядит следующим образом:
display(df)

trend price
0 1 23
1 1 43
2 1 56
3 1 21
4 2...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
24 июл 2024, 18:04
Как рассчитать экспоненциальное скользящее среднее (EMA) посредством итераций записи в кадре данных pandas

Последнее сообщение Anonymous « 24 сен 2024, 05:08
Добавлено в форуме Python

Anonymous » 24 сен 2024, 05:08 » в форуме Python

Я создал кадр данных pandas следующим образом:
import pandas as pd
import numpy as np

ds = { 'trend' : , 'price' : }

df = pd.DataFrame(data=ds)

Кадр данных выглядит следующим образом:
display(df)
trend price
0 1 23
1 1 43
2 1 56
3 1 21
4 2 43...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
24 сен 2024, 05:08
Функция для поиска всех имен, присутствующих и отсутствующих в кадре данных проверки, в другом кадре данных в Pandas.

Последнее сообщение Anonymous « 21 окт 2024, 23:17
Добавлено в форуме Python

Anonymous » 21 окт 2024, 23:17 » в форуме Python

У меня есть фрейм данных, который содержит следующую структуру:

А мне нужно проверить, присутствуют ли строки из столбца Имя из столбцов МНЕМОНИКА 1, 2, 3 и так далее, по контрольному списку, имеющему следующий формат:
p>

Что мне нужно...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 23:17
Функция для поиска всех имен, присутствующих и отсутствующих в кадре данных проверки, в другом кадре данных в Pandas.

Последнее сообщение Anonymous « 22 окт 2024, 03:48
Добавлено в форуме Python

Anonymous » 22 окт 2024, 03:48 » в форуме Python

У меня есть фрейм данных, который содержит следующую структуру:

А мне нужно проверить, присутствуют ли строки из столбца Имя из столбцов МНЕМОНИКА 1, 2, 3 и так далее, по контрольному списку, имеющему следующий формат:
p>

Что мне нужно...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
22 окт 2024, 03:48
Как автоматически создавать счет и автоматически проверять счет при подтверждении заказа на продажу в odoo

Последнее сообщение Anonymous « 09 янв 2025, 09:06
Добавлено в форуме Python

Anonymous » 09 янв 2025, 09:06 » в форуме Python

'Как автоматически передать доставку/сбор при подтверждении предложения о продаже.
Автоматическое создание счета и автоматическая проверка счета при подтверждении заказа на продажу в odoo.'

Подробнее здесь:

0 Ответы

48 Просмотры

Последнее сообщение Anonymous
09 янв 2025, 09:06

Вернуться в «Python»