Лучший способ разместить несколько файлов модели Pytorch для вывода? - Цифровое Кемерово

Лучший способ разместить несколько файлов модели Pytorch для вывода? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Лучший способ разместить несколько файлов модели Pytorch для вывода?

Цитата

Сообщение Anonymous » 31 окт 2023, 07:00

Контекст: [*]Я работаю со сквозной структурой TTS глубокого обучения (вы вводите текст, а он возвращает wav-объект) [*]Я создал конечную точку FastAPI в Docker-контейнере, который использует структуру TTS для вывода. [*]Мой клиентский интерфейс обращается к этой конечной точке FastAPI, чтобы сделать вывод на сервере графического процессора. [*]У меня будет несколько докер-контейнеров за балансировщиком нагрузки (haproxy), на которых будет работать один и тот же образ конечной точки FastAPI. Мои вопросы: [*]Выбор хранилища. Каков рекомендуемый подход к размещению файлов модели при развертывании нескольких контейнеров Docker? Следует ли мне использовать тома Docker или целесообразно использовать облачные хранилища, такие как S3 или Digital Ocean Spaces, для централизованного хранения моделей? [*]Проблемы с задержкой. Как минимизировать задержку при получении моделей из облачного хранилища? Существуют ли конкретные методы или оптимизации (кэширование, частичная загрузка и т. д.), которые можно реализовать для уменьшения влияния задержки, особенно при переключении между различными моделями для вывода?
Я все еще изучаю mlops, поэтому буду благодарен за любую помощь.

1698724813

Anonymous

Контекст:  [*]Я работаю со сквозной структурой TTS глубокого обучения (вы вводите текст, а он возвращает wav-объект) [*]Я создал конечную точку FastAPI в Docker-контейнере, который использует структуру TTS для вывода. [*]Мой клиентский интерфейс обращается к этой конечной точке FastAPI, чтобы сделать вывод на сервере графического процессора. [*]У меня будет несколько докер-контейнеров за балансировщиком нагрузки (haproxy), на которых будет работать один и тот же образ конечной точки FastAPI.  Мои вопросы:  [*][b]Выбор хранилища[/b]. Каков рекомендуемый подход к размещению файлов модели при развертывании нескольких контейнеров Docker? Следует ли мне использовать тома Docker или целесообразно использовать облачные хранилища, такие как S3 или Digital Ocean Spaces, для централизованного хранения моделей? [*][b]Проблемы с задержкой.[/b] Как минимизировать задержку при получении моделей из облачного хранилища? Существуют ли конкретные методы или оптимизации (кэширование, частичная загрузка и т. д.), которые можно реализовать для уменьшения влияния задержки, особенно при переключении между различными моделями для вывода?  
Я все еще изучаю mlops, поэтому буду благодарен за любую помощь.

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»

Programmiererforum