HBase ASYNC WAL, когда я могу восстановить данные из KafkaJAVA

Программисты JAVA общаются здесь
Ответить
Гость
 HBase ASYNC WAL, когда я могу восстановить данные из Kafka

Сообщение Гость »

Я хочу оптимизировать использование HBase для более быстрой записи. У меня есть задача, которая читает тему Kafka, а затем на основе этого записывает в HBase. Поскольку у Kafka будет журнал всего, что нужно записать, из этого источника легко восстановиться. Я читаю «Книгу рецептов высокой производительности HBase» и вижу следующее примечание:

Обратите внимание, что это наводит на интересную мысль о том, когда использовать WAL, а когда нет. По умолчанию запись в WAL включена, и данные всегда записываются в WAL. Но если вы уверены, что данные можно перезаписать или небольшая потеря не повлияет на общий результат обработки, вы отключите запись в WAL. WAL обеспечивает простое и окончательное восстановление. Это основная причина, по которой по умолчанию он всегда включен. В сценариях, когда потеря данных неожиданна, следует оставить настройки по умолчанию; в противном случае измените его на использование memstore. Альтернативно вы можете запланировать аварийное восстановление.

Как настроить автоматическое восстановление? Я вижу 2 варианта:
  • Я пишу в HBase без WAL (только в memstore) и каким-то образом уведомляюсь, что записи были потеряны и не зафиксированы на диске. Затем я возвращаюсь к журналу Kafka и воспроизвожу его. или
  • Я пишу в HBase без WAL (только в memstore) и время от времени получаю от HBase уведомление о том, какое смещение Kafka можно зафиксировать.
Как мне это сделать?

Подробнее здесь: https://stackoverflow.com/questions/681 ... from-kafka
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «JAVA»