У меня есть список отчетов, которые я хочу обрабатывать партиями. Однако отчеты в каждой партии не должны быть слишком похожи друг на друга - сходство измеряется с использованием конкретной метрики. Если два отчета схожи, они не должны быть включены в одну и ту же партию. Это делает важным для того, чтобы каждая партия была максимально полной, не нарушая ограничения сходства.
Проблема в том, что в худшем случае, особенно когда многие подобные отчеты последовательно появляются в списке, партии могут стать очень маленькими.
Как я могу эффективно создавать партии, где отчеты в каждом batch сильны?
Подробнее здесь: https://stackoverflow.com/questions/797 ... -view-refr
Оптимизация партийной обработки с ограничением сходства материализованное обновления обзора ⇐ JAVA
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Оптимизация иерархического сходства сходства адреса на большем данных о данных с DASK
Anonymous » » в форуме Python - 0 Ответы
- 6 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Обновить материализованное представление последней версией файла s3 Starrocks.
Anonymous » » в форуме MySql - 0 Ответы
- 11 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Тип актерского состава не удался, потому что материализованное значение равна нулю
Anonymous » » в форуме C# - 0 Ответы
- 2 Просмотры
-
Последнее сообщение Anonymous
-