Потоковая передача ответов с сервера вывода Triton с помощью бэкэнда Python

Потоковая передача ответов с сервера вывода Triton с помощью бэкэнда Python ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Потоковая передача ответов с сервера вывода Triton с помощью бэкэнда Python

Цитата

Сообщение Anonymous » 22 ноя 2024, 23:49

Я использую сервер вывода Triton с серверной частью Python и в настоящий момент отправляю запросы gRPC. Кто-нибудь знает, как мы можем использовать серверную часть Python для потоковой передачи (например, ответов модели), потому что я не нашел в документации примеров, связанных с потоковой передачей.

Подробнее здесь: https://stackoverflow.com/questions/712 ... on-backend

1732308546

Anonymous

Я использую сервер вывода Triton с серверной частью Python и в настоящий момент отправляю запросы gRPC. Кто-нибудь знает, как мы можем использовать серверную часть Python для потоковой передачи (например, ответов модели), потому что я не нашел в документации примеров, связанных с потоковой передачей. 

Подробнее здесь: [url]https://stackoverflow.com/questions/71235347/streaming-responses-from-the-triton-inference-server-with-python-backend[/url]

Ответить

1 сообщение • Страница 1 из 1