Присоединяйтесь к большим данным в Hazelcast Jet

Присоединяйтесь к большим данным в Hazelcast Jet ⇐ JAVA

1 сообщение • Страница 1 из 1

Anonymous

Присоединяйтесь к большим данным в Hazelcast Jet

Сообщение Anonymous » 14 мар 2025, 18:34

Я работаю над приложением Hazelcast Jet, и я пытаюсь присоединиться к двум источникам, используя левое, правое или внутреннее соединение с большими данными, но я застрял ниже:
Вот мой код: < /p>

Код: Выделить всё

BatchStage batch1= pipeline.readFrom(companyListBatchSource);
BatchStage batch2= pipeline.readFrom(employeeListBatchSource);

//Getting group by key
BatchStageWithKey jdbcGroupByKey = batch1.groupingKey(a -> a.getSource1().get(col1));
BatchStageWithKey fileGroupByKey = batch2.groupingKey(b -> b.getSource1().get(col2));

BatchStage d = jdbcGroupByKey.aggregate2(AggregateOperations.toList(),fileGroupByKey,AggregateOperations.toList());
BatchStage jdbcBatchStageData = d.filter(h -> {
return !h.getValue().f0().isEmpty() && !h.getValue().f1().isEmpty();
}).map(e -> {
try {
List list = new ArrayList();
e.getValue().f0().forEach(z ->  {
if (e.getValue().f1().size() > 0) {
e.getValue().f1().forEach(z1 ->  {
List a = new ArrayList();
a.addAll((List)z);
a.addAll((List)z1);
list.add(a);
});
}
});
return list;
} catch (Exception e1) {
return null;
}
});
< /code>
Это работает нормально, но если есть большие данные, то он выходит из PF Memory из -за этой строки: < /p>
BatchStage d = jdbcGroupByKey.aggregate2(AggregateOperations.toList(),fileGroupByKey,AggregateOperations.toList());

Так что мне нужно, чтобы я как -то записываю это в файл и прочитал этот файл в потоковой передаче, чтобы он не повлиял на память, да, это будет медленное, но не выйдет из памяти.
будет здорово, если кто -то сможет помочь.

Подробнее здесь: https://stackoverflow.com/questions/795 ... elcast-jet

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «JAVA»