Реализация генератора Python не снижает потребление памяти

Реализация генератора Python не снижает потребление памяти ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Реализация генератора Python не снижает потребление памяти

Цитата

Сообщение Anonymous » 04 окт 2024, 19:14

У меня есть три файла json.gz. Эти три файла содержат разные данные (рестораны, меню и сопоставления), сгруппированные по разным идентификаторам. Я должен прочитать их все и создать новые файлы JSON по идентификатору с соответствующими данными из этих трех файлов. У меня есть одна виртуальная машина, и у меня есть некоторые ограничения по памяти при запуске моего кода.
В начале я объединил эти три файла в три объекта json, а затем повторил их с помощью обычного for- петля. Благодаря этому решению мой код потребляет много памяти моей виртуальной машины, поскольку я загружаю все данные.
Я понял, что мне нужны только данные для определенного идентификатора для создания окончательного json. файл, и мне не следует загружать все данные для всех идентификаторов одновременно. Поэтому я подумал, что генератор Python будет решением в этом случае. Я создал следующий код:

Код: Выделить всё

from json import loads

def load_data_set(string_restaurants_data: str,
string_menus_data: str,
string_matchings_data: str,):

menus_data = loads(string_menus_data)
matchings_data = loads(string_matchings_data)
restaurants_data = loads(string_restaurants_data)

for id, menu_data in menus_data.items():
yield id, restaurants_data[id], menu_data, matchings_data[id] if id in matchings_data else "{}"

def main():
'''
some code to read the json.gz files. The data is stored in these three string variables: string_restaurants_data, string_menus_data and string_matchings_data
'''

restaurants_data_set = load_data_set(string_restaurants_data,
string_menus_data,
string_matchings_data)

size_generator = sys.getsizeof(restaurants_data_set)

del string_menus_data
del string_restaurants_data
del string_matchings_data
gc.collect()

list_result = {}
for restaurant in restaurants_data_set:
result_data = aggregate_menu_data(restaurant[0],
dumps(restaurant[2]),
dumps(restaurant[1]),
dumps(restaurant[3]),
string_parameters,
eval(debug))

list_result.update(result_data)

data['result'] = dumps(list_result)

Я проверил Диспетчер задач в ВМ и не увидел существенного снижения потребления памяти по сравнению с предыдущей версией без генераторов. Может ли кто-нибудь сообщить мне, правильно ли я реализовал генератор Python для решения моей потребности? или есть лучший способ загрузить только в память данные, необходимые для создания файла JSON, не влияя на скорость?
Версия Python: 3.11

Подробнее здесь: https://stackoverflow.com/questions/790 ... onsumption

1728058474

Anonymous

У меня есть три файла json.gz. Эти три файла содержат разные данные (рестораны, меню и сопоставления), сгруппированные по разным идентификаторам. Я должен прочитать их все и создать новые файлы JSON по идентификатору с соответствующими данными из этих трех файлов. У меня есть одна виртуальная машина, и у меня есть некоторые ограничения по памяти при запуске моего кода.
В начале я объединил эти три файла в три объекта json, а затем повторил их с помощью обычного for- петля. Благодаря этому решению мой код потребляет много памяти моей виртуальной машины, поскольку я загружаю все данные.
Я понял, что мне нужны только данные для определенного идентификатора для создания окончательного json. файл, и мне не следует загружать все данные для всех идентификаторов одновременно. Поэтому я подумал, что генератор Python будет решением в этом случае. Я создал следующий код:
[code]from json import loads

def load_data_set(string_restaurants_data: str,
string_menus_data: str,
string_matchings_data: str,):

menus_data = loads(string_menus_data)
matchings_data = loads(string_matchings_data)
restaurants_data = loads(string_restaurants_data)

for id, menu_data in menus_data.items():
yield id, restaurants_data[id], menu_data, matchings_data[id] if id in matchings_data else "{}"

def main():
'''
some code to read the json.gz files. The data is stored in these three string variables: string_restaurants_data, string_menus_data and string_matchings_data
'''

restaurants_data_set = load_data_set(string_restaurants_data,
string_menus_data,
string_matchings_data)

size_generator = sys.getsizeof(restaurants_data_set)

del string_menus_data
del string_restaurants_data
del string_matchings_data
gc.collect()

list_result = {}
for restaurant in restaurants_data_set:
result_data = aggregate_menu_data(restaurant[0],
dumps(restaurant[2]),
dumps(restaurant[1]),
dumps(restaurant[3]),
string_parameters,
eval(debug))

list_result.update(result_data)

data['result'] = dumps(list_result)

[/code]
Я проверил Диспетчер задач в ВМ и не увидел существенного снижения потребления памяти по сравнению с предыдущей версией без генераторов. Может ли кто-нибудь сообщить мне, правильно ли я реализовал генератор Python для решения моей потребности? или есть лучший способ загрузить только в память данные, необходимые для создания файла JSON, не влияя на скорость?
Версия Python: 3.11 

Подробнее здесь: [url]https://stackoverflow.com/questions/79054914/python-generator-implementation-is-not-reducing-memory-consumption[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Разница в показателях производительности с clang — использование генератора Ninja и генератора Visual Studio

Последнее сообщение Anonymous « 07 ноя 2024, 08:59
Добавлено в форуме C++

Anonymous » 07 ноя 2024, 08:59 » в форуме C++

Недавно я пытался поэкспериментировать, создав одно и то же приложение в Clang с помощью генератора ninja и генератора Visual Studio с использованием cmake. Замечено, что Ninja Generator дает явное преимущество с точки зрения производительности по...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 08:59
Функция Google Cloud снижает скорость загрузки (Gen 2 Cloud Run)

Последнее сообщение Anonymous « 03 июл 2024, 05:23
Добавлено в форуме Python

Anonymous » 03 июл 2024, 05:23 » в форуме Python

Я написал облачную функцию второго поколения, с помощью которой загружается большое видео с YouTube в разрешении 1080p. Из-за этого он загружает видео и аудио отдельно. Я максимально использовал ресурсы, выделенные для этой функции: 8 процессоров,...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 05:23
Запуск приложения с Qt6.7 в Android снижает функциональность QList

Последнее сообщение Anonymous « 16 сен 2024, 10:08
Добавлено в форуме Android

Anonymous » 16 сен 2024, 10:08 » в форуме Android

Я создаю приложение, которое будет искать устройства Bluetooth, а затем подключаться к одному из моих датчиков и отображать данные датчика. У меня есть основной виджет, а поиск устройств происходит во втором виджете. Сначала я создал свое приложение...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 10:08
Разве наложение приостанавливаемых функций не снижает производительность?

Последнее сообщение Anonymous « 12 окт 2024, 21:55
Добавлено в форуме Android

Anonymous » 12 окт 2024, 21:55 » в форуме Android

Углубляясь в разработку Android/Kotlin, я узнал, что ключевое слово suspend преобразует функцию в конечный автомат, который можно удалить из исполняемого потока, приостановить и возобновить в какой-то момент в будущем. либо тем же потоком, либо...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
12 окт 2024, 21:55
Как подготовленные операторы PHP PDO предотвращают внедрение sql? Каковы еще преимущества использования PDO? Снижает ли

Последнее сообщение Anonymous « 30 окт 2024, 23:31
Добавлено в форуме Php

Anonymous » 30 окт 2024, 23:31 » в форуме Php

Я заметил предложение «Подготовленные операторы PHP PDO предотвращают внедрение SQL».

Как php PDO (подготовленные операторы PDO) предотвращают внедрение SQL?
Каковы другие плюсы и минусы использования PDO (подготовленные операторы PDO)?
Снижает...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 23:31

Вернуться в «Python»