Задание потоковой передачи Synapse Spark начинает неоднократно использовать всю очередьPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Задание потоковой передачи Synapse Spark начинает неоднократно использовать всю очередь

Сообщение Anonymous »

У меня есть конвейер потоковой передачи Spark в Azure Synapse, который постоянно прослушивает события. Это в основном код Python с потоком чтения/записи. Потоковая передача работала нормально, когда события обрабатывались последовательно в микропакете. Мы разделяем конвейер на несколько частей с помощью фильтрованного запроса к концентратору событий. После этого конвейер неоднократно запускался с первого события в концентраторе событий после использования всех доступных событий в концентраторах событий. Каким-то образом он снова начинает потреблять данные с первого события, как только обрабатывает все события. Потоковый запрос основан на отфильтрованном наборе событий, и каждый отфильтрованный набор имеет отдельную контрольную точку и отдельный конвейер. В чем может быть причина такого поведения и как этого избежать?
startingOffset: "earliest"
failOnDataLoss:False
Ожидается, что контрольная точка останется на месте после использования всех событий и не перезапустится с первого доступного события, потребляя только новые события. Любые указания приветствуются.

Подробнее здесь: https://stackoverflow.com/questions/789 ... repeatedly
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»