Конвейеры работали нормально в течение месяца. Позже контейнеры конвейера начали выходить из строя из-за ошибки Docker 137.
Примечание. Мы запланировали запуск обновлений yum на машине-исполнителе каждую неделю.
Сбой конвейера Bitbucket.
Итак, ниже приведены действия, которые я выполнил.
[*]Проверил обновления Yum и системные журналы, чтобы узнать, есть ли что-нибудь. ненормально.
[*]Перезапустил службу Docker и перезагрузил компьютер.
[*]Контролировался процессор и память во время выполнения конвейера.
[*]Обновлено. последняя версия Bitbucket Runner.
[*]Увеличенная конфигурация ЦП и памяти компьютера.
[*]Проверено свободное пространство, которое составляет всего 35 %.
Мне ничего не помогло. Конвейеры продолжали выходить из строя с той же ошибкой.
Поэтому позже, поскольку проблема была непредсказуемой, с помощью команды поддержки AWS я перенес всех исполнителей на машину AMI, оптимизированную для ECS, поскольку этот AMI в основном предназначен для контейнеров. То же самое произошло и с этой машиной. Через месяц конвейеры начали выходить из строя из-за той же ошибки.
На этот раз я повторно исследовал проблему и вручную проверил с помощью обновлений yum, есть ли какие-либо обновления, не соответствующие Docker.Примечание. Контейнер Runner запущен и работает правильно, но контейнеры конвейера выдают ошибку 137, что не связано с проблемой OOM и хранилища.
Позже мы снова переместил его на другую машину Amazon Linux. Та же проблема уже третий раз за месяц.
Ничего не помогает. В ходе расследования выяснилось, что удаление объявления «Docker как услуга» в конвейере обеспечивает успешность работы конвейера. Ниже приведен пример конфигурации конвейера.
Код: Выделить всё
- step:
name: generate dbt elementary report
image:
name: edr-build:latest
clone:
enabled: true
runs-on:
- 'linux'
- 'self.hosted'
- 'test'
services:
- docker
caches:
- docker
script:
- docker --version
- docker build -t .
- docker push to
И конвейеры внезапно выходят из строя . Если действительно что-то связано с разделом Services:Docker или, если что-то связано с машиной-бегуном, конвейеры должны выйти из строя с ошибкой 137 с самого начала.
Я не могу для просмотра любых журналов контейнеров конвейера, которые выходят из строя, поскольку они уничтожаются сразу после завершения выполнения конвейера. Я также не могу перечислить их с помощью «docker ps -a». Все записи контейнеров конвейера стираются, что может быть связано с функциональностью Bitbucket runner.
По-прежнему не уверен, где и что проверять при этой ошибке, поскольку эта проблема возникает на нескольких машинах. .
Примечание: версия Docker одинакова на всех машинах.
Пожалуйста, помогите мне с этим.
Подробнее здесь: https://stackoverflow.com/questions/790 ... t-code-137