У меня один домен с несколькими пространствами. В каждом из этих пространств выполняются модели для конкретных случаев использования. Каждое из этих пространств имеет определенный набор зависимостей/библиотек Python, которые необходимо установить после первого создания записной книжки или при добавлении новой библиотеки.
В соответствии с моим поиском это можно сделать двумя способами: создать собственные образы Docker или использовать конфигурации жизненного цикла.
Я исключил опцию настройки жизненного цикла по двум причинам:
- Он будет загружать все библиотеки каждый раз, когда создается новый сеанс, и у меня есть несколько тяжелых библиотек, которые я не хочу устанавливать при каждом новом сеансе. Я хочу запустить их только один раз при первом запуске блокнота.
- Мне нужно загрузить контрольную точку из книги Colab, что, как я полагаю, будет немного сложно сделать с помощью конфигураций жизненного цикла.
Пожалуйста, поправьте меня, если я ошибаюсь и вы считаете, что жизненный цикл — это подходящий подход.
- создать образ докера для загрузки всех библиотек. Включите команду для загрузки контрольной точки и сохранения загруженного файла в корзине S3.
- загрузите образ в репозиторий ECR и переместите его в нужную среду.
Вопрос: нужно ли мне создавать пространства sagemaker на основе пользовательского образа или я должен указать его на собственный образ? По сути, как мне использовать собственное изображение? Потому что у меня есть зависимости, специфичные для пространства. Кроме того, будет ли этот образ извлекаться только один раз при первом запуске записной книжки или каждый раз при создании нового сеанса? Если это так, то почему бы не использовать конфигурацию жизненного цикла?
Спасибо.
Подробнее здесь: https://stackoverflow.com/questions/793 ... -sagemaker