Spring Batch: как БЫСТРО ВСТАВИТЬ В ТАБЛИЦУ 1 миллион сообщений от Kafka

Spring Batch: как БЫСТРО ВСТАВИТЬ В ТАБЛИЦУ 1 миллион сообщений от Kafka ⇐ JAVA

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Spring Batch: как БЫСТРО ВСТАВИТЬ В ТАБЛИЦУ 1 миллион сообщений от Kafka

Цитата

Сообщение Anonymous » 19 сен 2024, 12:36

Я пишу вам это сообщение, потому что немного растерян и не знаю, как решить свою проблему.
Контекст

SimpleJob(SingleThread) в Spring Batch, который обрабатывает 1 миллион сообщений из темы (внутренний доверенный источник) каждое утро в 7 утра
и вставляет их (по одному) one) в промежуточную таблицу (A)
Затем считывает строки из A частями по 1000 строк и вставляет эти строки (одну за другой) в целевую таблицу B

Технологии
JAVA 17, Spring Batch, MySQL
ПроблемаНа выполнение работы уходит 23 часа. Мне бы хотелось сократить время до менее 2 часов.
Предложения по улучшению

Удаление промежуточной таблицы : позволит использовать SELECT/INSERT меньше 1 миллиона. Я спросил бывших разработчиков, есть ли причины поддерживать эту таблицу (не используемую где-либо еще).
ИСПОЛЬЗОВАНИЕ МАССОВОЙ ВСТАВКИ: я читал, что это поможет повысить производительность.
Увеличить размер фрагмента (интервал фиксации): фрагмент из 1000 швов слишком мал, поэтому нужно больше SELECT/INSERT. Размер фрагмента необходим, чтобы избежать ошибок OutOfMemory Java Heap Space. Но я не знаю, как определить правильный размер фрагмента, кроме случайного тестирования значений

Вопросы

Видите ли вы веские причины для использования промежуточной таблицы в этом случае?
Вы знаете, как мне определить правильный размер фрагмента?

Существуют ли какие-либо стандарты в отношении значений?
Могу ли я пробовать случайные значения только до тех пор, пока оно не завершится в приемлемое время?

[*]Как вы думаете, можно ли попробовать секционированное задание? / Многопоточные задания могут быть полезны в моем случае? Или это будет излишним?

Поскольку все потоки будут писать в одну и ту же базу данных (возможное узкое место?)< /li>

Заранее большое спасибо за помощь!

Подробнее здесь: https://stackoverflow.com/questions/790 ... from-kafka

1726738612

Anonymous

Я пишу вам это сообщение, потому что немного растерян и не знаю, как решить свою проблему.
Контекст
[list]
[*]SimpleJob(SingleThread) в Spring Batch, который обрабатывает 1 миллион сообщений из темы (внутренний доверенный источник) каждое утро в 7 утра
[*]и вставляет их (по одному) one) в промежуточную таблицу (A)
[*]Затем считывает строки из A частями по 1000 строк и вставляет эти строки (одну за другой) в целевую таблицу B
[/list]
Технологии
JAVA 17, Spring Batch, MySQL
ПроблемаНа выполнение работы уходит 23 часа. Мне бы хотелось сократить время до менее 2 часов.
Предложения по улучшению
[list]
[*][b]Удаление промежуточной таблицы [/b]: позволит использовать SELECT/INSERT меньше 1 миллиона. Я спросил бывших разработчиков, есть ли причины поддерживать эту таблицу (не используемую где-либо еще).
[*][b]ИСПОЛЬЗОВАНИЕ МАССОВОЙ ВСТАВКИ[/b]: я читал, что это поможет повысить производительность.
[b]Увеличить размер фрагмента (интервал фиксации)[/b]: фрагмент из 1000 швов слишком мал, поэтому нужно больше SELECT/INSERT. Размер фрагмента необходим, чтобы избежать ошибок OutOfMemory Java Heap Space. [b]Но я не знаю, как определить правильный размер фрагмента, кроме случайного тестирования значений[/b]
[/list]
Вопросы
[list]
[*][b]Видите ли вы веские причины для использования промежуточной таблицы в этом случае?[/b]
[*][b]Вы знаете, как мне определить правильный размер фрагмента?[/b]

Существуют ли какие-либо стандарты в отношении значений?
[*] Могу ли я пробовать случайные значения только до тех пор, пока оно не завершится в приемлемое время?
[/list]

[*][b]Как вы думаете, можно ли попробовать секционированное задание? / Многопоточные задания могут быть полезны в моем случае?[/b] Или это будет излишним?
[list]
Поскольку все потоки будут писать в одну и ту же базу данных (возможное узкое место?)< /li>
[/list]


Заранее большое спасибо за помощь! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79001882/spring-batch-how-to-have-fast-insert-into-table-1-million-messages-from-kafka[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Spring Batch: как БЫСТРО ВСТАВИТЬ В ТАБЛИЦУ 1 миллион сообщений от Kafka

Последнее сообщение Anonymous « 19 сен 2024, 18:53
Добавлено в форуме JAVA

Anonymous » 19 сен 2024, 18:53 » в форуме JAVA

Я пишу вам это сообщение, потому что немного растерян и не знаю, как решить свою проблему.
Контекст

SimpleJob(SingleThread) в Spring Batch, который обрабатывает 1 миллион сообщений из темы (внутренний доверенный источник) каждое утро в 7 утра
и...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 18:53
Kafka Streams и Spring Batch Conflict – «Необходимо указать имя задания», несмотря на Spring.batch.job.enabled: false

Последнее сообщение Anonymous « 02 окт 2024, 11:08
Добавлено в форуме JAVA

Anonymous » 02 окт 2024, 11:08 » в форуме JAVA

У меня есть приложение Spring Boot, в котором я использую Kafka Streams (KStream и GlobalKTable) вместе с пакетным заданием Spring. Несмотря на настройку Spring.batch.job.enabled: false, я продолжаю сталкиваться со следующей ошибкой:

Вызвано:...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
02 окт 2024, 11:08
Как я могу сгенерировать миллион строк в Java и вставить в таблицу Oracle DB [закрыто]

Последнее сообщение Гость « 27 фев 2024, 20:10
Добавлено в форуме JAVA

Гость » 27 фев 2024, 20:10 » в форуме JAVA

Мне нужно вставить миллион случайных строк в базу данных Oracle из Java-кода в таблицу сотрудников, где есть - (имя, дата, пол), нужно вставить примерно 50/50 мужчин и женщин, а также чтобы имена тоже были равномерно распределены (от А до Я)...

0 Ответы

27 Просмотры

Последнее сообщение Гость
27 фев 2024, 20:10
Как достичь 100 000 TPS с размером сообщений 3 КБ в Java Spring Boot с помощью Kafka? - Kafka Performance Spe. Java Spri

Последнее сообщение Anonymous « 06 май 2025, 10:10
Добавлено в форуме JAVA

Anonymous » 06 май 2025, 10:10 » в форуме JAVA

В настоящее время я работаю над проектом, используя Java Spring Boot и Apache Kafka, где несколько микросервисов общаются через Kafka. Наша цель состоит в том, чтобы обрабатывать 100 000 транзакций в секунду (TPS) (или события журнала), при этом...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
06 май 2025, 10:10
Как вставить 1 миллион строк в базу данных Oracle с Python?

Последнее сообщение Anonymous « 20 фев 2025, 01:10
Добавлено в форуме Python

Anonymous » 20 фев 2025, 01:10 » в форуме Python

У меня есть ~ 100 000 до 1 000 000 строк для вставки в базу данных Oracle18c. Я совершенно новый с Oracle и этим порядком данных. Я считаю, что должен быть какой -то оптимальный способ сделать это, но сейчас мне удалось только внедрить строку по...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 01:10

Вернуться в «JAVA»