Как оптимизировать использование ЦП и памяти при создании больших файлов CSV с помощью Node.js и Sequelize? - Цифровое Кемерово

Как оптимизировать использование ЦП и памяти при создании больших файлов CSV с помощью Node.js и Sequelize? ⇐ Php

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как оптимизировать использование ЦП и памяти при создании больших файлов CSV с помощью Node.js и Sequelize?

Цитата

Сообщение Anonymous » 01 мар 2024, 13:18

Я разрабатываю приложение Node.js, которое генерирует отчеты CSV на основе данных, полученных с помощью Sequelize из базы данных PostgreSQL. Хотя решение хорошо работает для небольших наборов данных, загрузка ЦП возрастает до 100 %, а потребление памяти значительно увеличивается при создании файлов CSV, содержащих более 100 тысяч записей.

Вот упрощенная версия функции, отвечающей за создание отчета CSV:

exports.createReport= (имя_файла, путь к файлу, ответ) => { вернуть новое обещание((разрешить, отклонить) => { const ws = fs.createWriteStream(filePath); const totalCount = response.count; ws.on('ошибка', (ошибка) => { отклонить (ошибка); }); response.rows.forEach(row => { let temp1 = JSON.stringify(row.dataValues.offer_details); row.dataValues.offer_details = tempOfferDetails; let temp2 = JSON.stringify(row.dataValues.allowances); row.dataValues.allowances = tempAllowances; пусть temp3 = JSON.stringify(row.dataValues.failure_reason); row.dataValues.failure_reason = tempFailureReason; }); const csvStream = fastcsv .format({ заголовки: true }) .on('конец', () => { console.log("Запись CSV завершена"); решать({ 'имя_файла': Имя_файла, 'filePath': FilePath, 'totalRows': TotalCount }); }); response.rows.forEach(row => { csvStream.write(row.dataValues); }); csvStream.pipe(WS); }); } Однако этот подход становится неэффективным для больших наборов данных, в результате чего загрузка ЦП достигает 100 %, а потребление памяти значительно увеличивается. Какие оптимизации я могу реализовать, чтобы повысить производительность создания CSV, особенно для наборов данных, превышающих 100 тысяч записей?

Любые предложения/решения/подходы будем очень признательны. Спасибо!

Вышеупомянутое отлично работает на локальном уровне, даже количество записей достигает миллиона, но я использую микросервисную архитектуру, и php получает файл от Nodejs. Это также отлично работает для записей размером менее 100 КБ. Приложение Nodejs развернуто на K PODS, и с помощью консоли и ведения журнала я видел, что когда мы получаем записи более 100 000, наш запрос на секвализацию завершается успешно, но после этого он ничего не консолидирует в файловой функции и не выдает ошибку, но процессор внезапно становится 100%

Я также проверил тайм-аут nginx и ограничение размера файла, все в порядке

Реклама

1709288306

Anonymous


Я разрабатываю приложение Node.js, которое генерирует отчеты CSV на основе данных, полученных с помощью Sequelize из базы данных PostgreSQL. Хотя решение хорошо работает для небольших наборов данных, загрузка ЦП возрастает до 100 %, а потребление памяти значительно увеличивается при создании файлов CSV, содержащих более 100 тысяч записей.
 
Вот упрощенная версия функции, отвечающей за создание отчета CSV:
 
exports.createReport= (имя_файла, путь к файлу, ответ) => {     вернуть новое обещание((разрешить, отклонить) => {         const ws = fs.createWriteStream(filePath);         const totalCount = response.count;         ws.on('ошибка', (ошибка) => {             отклонить (ошибка);         });         response.rows.forEach(row => {             let temp1 = JSON.stringify(row.dataValues.offer_details);             row.dataValues.offer_details = tempOfferDetails;             let temp2 = JSON.stringify(row.dataValues.allowances);             row.dataValues.allowances = tempAllowances;             пусть temp3 = JSON.stringify(row.dataValues.failure_reason);             row.dataValues.failure_reason = tempFailureReason;         });         const csvStream = fastcsv             .format({ заголовки: true })             .on('конец', () => {                 console.log("Запись CSV завершена");                 решать({                     'имя_файла': Имя_файла,                     'filePath': FilePath,                     'totalRows': TotalCount                 });             });         response.rows.forEach(row => {             csvStream.write(row.dataValues);         });         csvStream.pipe(WS);     }); }  Однако этот подход становится неэффективным для больших наборов данных, в результате чего загрузка ЦП достигает 100 %, а потребление памяти значительно увеличивается. Какие оптимизации я могу реализовать, чтобы повысить производительность создания CSV, особенно для наборов данных, превышающих 100 тысяч записей?
 
Любые предложения/решения/подходы будем очень признательны. Спасибо!
 
[b]Вышеупомянутое отлично работает на локальном уровне, даже количество записей достигает миллиона, но я использую микросервисную архитектуру, и php получает файл от Nodejs. Это также отлично работает для записей размером менее 100 КБ. Приложение Nodejs развернуто на K PODS, и с помощью консоли и ведения журнала я видел, что когда мы получаем записи более 100 000, наш запрос на секвализацию завершается успешно, но после этого он ничего не консолидирует в файловой функции и не выдает ошибку, но процессор внезапно становится 100% [/b]
 
[b]Я также проверил тайм-аут nginx и ограничение размера файла, все в порядке[/b]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как оптимизировать использование памяти при обработке больших зашифрованных файлов Excel в Java?

Последнее сообщение Anonymous « 28 янв 2025, 14:30
Добавлено в форуме JAVA

Anonymous » 28 янв 2025, 14:30 » в форуме JAVA

Я работаю над приложением Java Patch, которое обрабатывает большие зашифрованные файлы Excel. Процесс включает в себя:

Извлечение зашифрованного файла Excel из ведра GCS.

расшифровывает файл с помощью pgp.

Разбор файла и извлечение данных...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
28 янв 2025, 14:30
Как я могу оптимизировать производительность моего сценария Python при обработке больших файлов CSV?

Последнее сообщение Anonymous « 20 сен 2024, 10:57
Добавлено в форуме Python

Anonymous » 20 сен 2024, 10:57 » в форуме Python

Я работаю над сценарием Python, который обрабатывает очень большой файл CSV (около 5 ГБ), но заметил значительные проблемы с производительностью. Я хочу оптимизировать свой код для большей эффективности. Вот упрощенная версия того, что у меня есть:...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
20 сен 2024, 10:57
Как я могу оптимизировать производительность моего сценария Python при обработке больших файлов CSV?

Последнее сообщение Anonymous « 20 сен 2024, 12:04
Добавлено в форуме Python

Anonymous » 20 сен 2024, 12:04 » в форуме Python

Я работаю над сценарием Python, который обрабатывает очень большой файл CSV (около 5 ГБ), но заметил значительные проблемы с производительностью. Я хочу оптимизировать свой код для большей эффективности. Вот упрощенная версия того, что у меня есть:...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
20 сен 2024, 12:04
Как оптимизировать обработку больших файлов CSV?

Последнее сообщение Anonymous « 23 окт 2024, 01:08
Добавлено в форуме Python

Anonymous » 23 окт 2024, 01:08 » в форуме Python

TL;DR: Я обрабатываю большой CSV-файл (4 миллиона строк, 510 столбцов), но мне нужно всего несколько тысяч строк со всеми столбцами в конце. Весь процесс занимает более 70 минут и требует много памяти. Ищу способы оптимизации рабочего процесса с...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 01:08
Как оптимизировать обработку больших файлов CSV?

Последнее сообщение Anonymous « 23 окт 2024, 13:33
Добавлено в форуме Python

Anonymous » 23 окт 2024, 13:33 » в форуме Python

TL;DR: Я обрабатываю большой CSV-файл (4 миллиона строк, 510 столбцов), но мне нужно всего несколько тысяч строк со всеми столбцами в конце. Весь процесс занимает более 70 минут и требует много памяти. Ищу способы оптимизации рабочего процесса с...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 13:33

Вернуться в «Php»

Programmiererforum