Как непрерывно сохранять локально большие данные из пошаговой потоковой передачи, не перегружая оперативную память? - Цифровое Кемерово

Как непрерывно сохранять локально большие данные из пошаговой потоковой передачи, не перегружая оперативную память? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Гость

Как непрерывно сохранять локально большие данные из пошаговой потоковой передачи, не перегружая оперативную память?

Цитата

Сообщение Гость » 01 мар 2024, 15:19

Я хочу сохранить локально все тиковые данные от брокера, не перегружая оперативную память. Трансляция начинается в воскресенье и заканчивается в первые часы субботы. В любое время в течение недели я хочу иметь возможность загрузить файл с жесткого диска и проанализировать «пока что» обновления.

Иногда количество тиков может превышать 1000 или даже 10 000 в секунду. Я хочу подписаться на 40 инструментов (например, EURUSD).

Итак, как лучше всего это сделать в Python?

Вот что я пробовал:

Любой фрейм данных pandas:

df = pd.DataFrame(columns=['Time_sent', 'Time_received', 'Instrument', 'Bid', 'Ofr']) И затем при любом обновлении я объединяю новую строку:

df = pd.concat([df, pd.DataFrame([[datetime.fromtimestamp(int(update.get_time())/1000), дата-время.сейчас(), update.get_instrument(), update.get_bid_value(), update.get_ofr_value()]], columns=df.columns)], ignore_index=True) И наконец, обновляю галочки:

df.to_pickle('ticks.pkl') Но у него есть два недостатка: он излишне перегружает оперативную память и при любом обновлении перезаписывает файл Tickets.pkl, поэтому, если он большой, требуется много времени, и я не могу так легко получить к нему доступ в любое время.
>
Либо json:

Я определяю функцию:

defappend_record(запись): с open('ticks.json', 'a') как f: json.dump(запись, е) f.write(os.linesep) И потом, каждый раз, когда я устанавливаю обновление локально:

append_record({'Time_sent': update.get_time(), «Time_received»: datetime.now().timestamp() * 1000, «Инструмент»: update.get_instrument(), «Ставка»: get_bid_value(), 'Ofr': get_ofr_value()}) Но у него есть два недостатка: файл (ticks.json) намного больше, чем Tickets.pkl, и я не думаю, что это лучший и самый современный метод Python.

Какой совет? Может быть, мне стоит использовать базу данных SQL (SQLite) или h5? Как лучше всего сделать то, что я хочу? В любом случае мне не следует перезагружать/перечитывать сохраненный файл, дописывать его и потом снова сохранять. Это должно быть что-то поумнее.

Реклама

1709295590

Гость


Я хочу сохранить локально все тиковые данные от брокера, не перегружая оперативную память. Трансляция начинается в воскресенье и заканчивается в первые часы субботы. В любое время в течение недели я хочу иметь возможность загрузить файл с жесткого диска и проанализировать «пока что» обновления.
 
Иногда количество тиков может превышать 1000 или даже 10 000 в секунду. Я хочу подписаться на 40 инструментов (например, EURUSD).
 
Итак, как лучше всего это сделать в Python?
 
Вот что я пробовал:
 
Любой фрейм данных pandas:
 
df = pd.DataFrame(columns=['Time_sent', 'Time_received', 'Instrument', 'Bid', 'Ofr'])  И затем при любом обновлении я объединяю новую строку:
 
df = pd.concat([df, pd.DataFrame([[datetime.fromtimestamp(int(update.get_time())/1000),                                                  дата-время.сейчас(),                                                  update.get_instrument(),                                                  update.get_bid_value(),                                                  update.get_ofr_value()]], columns=df.columns)], ignore_index=True)  И наконец, обновляю галочки:
 
df.to_pickle('ticks.pkl')  Но у него есть два недостатка: он излишне перегружает оперативную память и при любом обновлении перезаписывает файл Tickets.pkl, поэтому, если он большой, требуется много времени, и я не могу так легко получить к нему доступ в любое время.
 > 
Либо json:
 
Я определяю функцию:
 
defappend_record(запись):     с open('ticks.json', 'a') как f:         json.dump(запись, е)         f.write(os.linesep)  И потом, каждый раз, когда я устанавливаю обновление локально:
 
append_record({'Time_sent': update.get_time(),                        «Time_received»: datetime.now().timestamp() * 1000,                        «Инструмент»: update.get_instrument(),                        «Ставка»: get_bid_value(),                        'Ofr': get_ofr_value()})  Но у него есть два недостатка: файл (ticks.json) намного больше, чем Tickets.pkl, и я не думаю, что это лучший и самый современный метод Python.
 
Какой совет? Может быть, мне стоит использовать базу данных SQL (SQLite) или h5? Как лучше всего сделать то, что я хочу? В любом случае мне не следует перезагружать/перечитывать сохраненный файл, дописывать его и потом снова сохранять. Это должно быть что-то поумнее.

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

В Debian (Kali) есть команда «график», позволяющая увидеть температуру, оперативную память, память и т. д.?

Последнее сообщение Anonymous « 17 янв 2025, 08:23
Добавлено в форуме Linux

Anonymous » 17 янв 2025, 08:23 » в форуме Linux

Я хочу видеть в реальном времени использование памяти, оперативной памяти, процессора и температуру на графике, например, как «net_graph» в CS 1.6. есть команда или программа, чтобы увидеть это?
Я использую Kali GNU/Linux kali-rolling 2024.4...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
17 янв 2025, 08:23
Для глубокого обучения: сохранять каждый образец отдельно или сохранять блоки? данные не помещаются в память

Последнее сообщение Anonymous « 02 авг 2024, 23:02
Добавлено в форуме Python

Anonymous » 02 авг 2024, 23:02 » в форуме Python

Я обучаю классификатора. Мои данные поступают из нескольких наборов данных, каждый набор данных содержит несколько субъектов, каждый субъект провел несколько испытаний. В настоящее время моя структура данных на диске выглядит следующим образом:...

0 Ответы

45 Просмотры

Последнее сообщение Anonymous
02 авг 2024, 23:02
Построить непрерывно непрерывно в React Native при запуске на эмуляторе

Последнее сообщение Anonymous « 29 май 2025, 15:31
Добавлено в форуме Android

Anonymous » 29 май 2025, 15:31 » в форуме Android

Получение этой ошибки непрерывно и даже после того, как попытка не мог ее решить.
Вот журналы ошибок
1: Task failed with an exception.
-----------
* What went wrong:
Execution failed for task ':app:buildCMakeDebug '.
>...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
29 май 2025, 15:31
Использование PipeStream для передачи потока ответов для ведения журнала без потери эффекта потоковой передачи для конеч

Последнее сообщение Anonymous « 03 май 2024, 06:06
Добавлено в форуме C#

Anonymous » 03 май 2024, 06:06 » в форуме C#

У меня есть конечная точка, которая передает List как IAsyncEnumerable в ответе, и поэтому при использовании в браузере ответ загружается с эффектом потоковой передачи по мере записи данных в поток ответа.
Теперь у меня также есть сквозное...

0 Ответы

90 Просмотры

Последнее сообщение Anonymous
03 май 2024, 06:06
Позволить компилятору выполнить работу, перегружая методы, не работает

Последнее сообщение Anonymous « 17 ноя 2024, 19:16
Добавлено в форуме JAVA

Anonymous » 17 ноя 2024, 19:16 » в форуме JAVA

Предположим, у меня есть следующая структура класса

public interface Searchable{

public boolean matches(String text);

}

public abstract class AbstractSearchable implements Searchable{

private String name;

public boolean matches(String text){...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
17 ноя 2024, 19:16

Вернуться в «Python»

Programmiererforum