Я использую сервер вывода Triton с серверной частью Python и в настоящий момент отправляю запросы gRPC. Кто-нибудь знает, как мы можем использовать серверную часть Python для потоковой передачи (например, ответов модели), потому что я не нашел в документации примеров, связанных с потоковой передачей.
Подробнее здесь: https://stackoverflow.com/questions/712 ... on-backend
Потоковая передача ответов с сервера вывода Triton с помощью бэкэнда Python ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Потоковая передача ответов с сервера вывода Triton с помощью бэкэнда Python
Anonymous » » в форуме Python - 0 Ответы
- 11 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Как отлаживать Triton Python, особенно проходит компилятор Triton-JIT?
Anonymous » » в форуме Python - 0 Ответы
- 23 Просмотры
-
Последнее сообщение Anonymous
-