Присоединяйтесь к быстро и медленно меняющимся неограниченным источникам в Apache Beam.JAVA

Программисты JAVA общаются здесь
Ответить
Anonymous
 Присоединяйтесь к быстро и медленно меняющимся неограниченным источникам в Apache Beam.

Сообщение Anonymous »

У меня есть два неограниченных источника (pubsub):
  • основной источник: часто выдает значения
  • вторичный источник: отправляет событие, которое говорит нам прочитать большую таблицу запросов, поскольку в таблице произошли изменения.
Я хочу расширить (левое соединение) основной источник с таблицей, считанной на основе вторичного источника.
У меня уже есть решение, в котором большие таблицы запросов считываются в начале, поэтому они ограничены. Для объединения я использовал Beam SQL, поскольку он довольно сложен, и я хочу его сохранить, поэтому я считаю, что использование бокового ввода невозможно, поскольку я не думаю, что смогу присоединиться к PCollection с помощью PCollectionView с использованием Beam SQL.
Я пытался использовать фиксированное окно с 5 секундами для каждого источника, но для второго источника последнее состояние не распространяется на окна, где ничего не изменилось. Поэтому после объединения источников я получаю правильные результаты только тогда, когда таблица BigQuery была обновлена, но когда ничего не изменилось (большую часть времени), я получаю нулевые значения справа.
Как Могу ли я повысить дискретизацию источника секунд, чтобы получить правильные результаты после объединения?

Подробнее здесь: https://stackoverflow.com/questions/793 ... pache-beam
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»