Я развернул модель преобразователя предложений для семантической проверки на сервере aws, который находится под балансировщиком нагрузки и в группе автомасштабирования. Я запускаю этот сервер, используя команду Gunicorn с uvicorn в качестве рабочего класса с тайм-аутом 3000 секунд. Наряду с этим я дал максимальное количество запросов до 1000, а дрожание - до 50. Но сервер выдает ответ как 504 при попытке доступа к этому серверу при доступе с сервера приложений. Я определил модель преобразователя предложений в корне вызова API (fastapi). В чем может быть причина получения ответа об ошибке 504 от вышестоящего сервера?
Я пытался загрузить модель в корень моего API-файла. Тогда система, которая раньше зависала, теперь не зависает. Но ошибка 504 все еще сохраняется
Подробнее здесь: https://stackoverflow.com/questions/790 ... der-autosc
Сервер возвращает 504 при доступе через балансировщик нагрузки, который находился в группе автомасштабирования. ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение