Работа с собственным образом докера в AWS Sagemaker

Работа с собственным образом докера в AWS Sagemaker ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Работа с собственным образом докера в AWS Sagemaker

Сообщение Anonymous » 24 окт 2025, 09:33

Я новичок в использовании сервисов AWS Sagemaker и Docker. У меня есть несколько вопросов по проектированию архитектуры для развертывания моей установки от тестового аккаунта AWS до рабочей среды.
У меня один домен с несколькими пространствами. В каждом из этих пространств выполняются модели для конкретных случаев использования. Каждое из этих пространств имеет определенный набор зависимостей/библиотек Python, которые необходимо установить после первого создания записной книжки или при добавлении новой библиотеки.
В соответствии с моим поиском это можно сделать двумя способами: создать собственные образы Docker или использовать конфигурации жизненного цикла.
Я исключил опцию настройки жизненного цикла по двум причинам:

Он будет загружать все библиотеки каждый раз, когда создается новый сеанс, и у меня есть несколько тяжелых библиотек, которые я не хочу устанавливать при каждом новом сеансе. Я хочу запустить их только один раз при первом запуске блокнота.
Мне нужно загрузить контрольную точку из книги Colab, что, как я полагаю, будет немного сложно сделать с помощью конфигураций жизненного цикла.
Пожалуйста, поправьте меня, если я ошибаюсь и вы считаете, что жизненный цикл — это подходящий подход.

Переход на собственный образ Docker, мое понимание процесса заключается в том, что мне следует:

создать образ докера для загрузки всех библиотек. Включите команду для загрузки контрольной точки и сохранения загруженного файла в корзине S3.
загрузите образ в репозиторий ECR и переместите его в нужную среду.
Вопрос: нужно ли мне создавать пространства sagemaker на основе пользовательского образа или я должен указать его на собственный образ? По сути, как мне использовать собственное изображение? Потому что у меня есть зависимости, специфичные для пространства. Кроме того, будет ли этот образ извлекаться только один раз при первом запуске записной книжки или каждый раз при создании нового сеанса? Если это так, то почему бы не использовать конфигурацию жизненного цикла?

Любая помощь в понимании того, как работает создание собственных изображений, будет очень признательна. Я просмотрел документацию AWS, но в моем понимании все еще есть пробелы.
Спасибо.

Подробнее здесь: https://stackoverflow.com/questions/793 ... -sagemaker

Anonymous

1 сообщение • Страница 1 из 1

Вернуться в «Python»