Я слежу за этой страницей: https://docs.agora.io/en/open- ai-integration/get-started/quickstart?platform=python. Я установил свой собственный бэкэнд на AWS EC2, и голосовая часть API реального времени OpenAI работает хорошо. Теперь я также хочу, чтобы клиент (Android и Ios) мог получить доступ к тексту, возвращаемому OpenAI.
Я заметил, что это официальная реализация бэкэнда: https://github.com /AgoraIO/openai-realtime-python/blob/main/realtime_agent/agent.py, -> _process_model_messages -> ResponseAudioTranscriptDelta, уже обеспечивает возврат текста:
Код: Выделить всё
case ResponseAudioTranscriptDelta():
# logger.info(f"Received text message {message=}")
asyncio.create_task(self.channel.chat.send_message(
ChatMessage(
message=to_json(message), msg_id=message.item_id
)
))
case ResponseAudioTranscriptDone():
logger.info(f"Text message done: {message=}")
asyncio.create_task(self.channel.chat.send_message(
ChatMessage(
message=to_json(message), msg_id=message.item_id
)
))
Спасибо за помощь!
Я пробовал использовать
1.signaling sdk
https://www.agora.io/en/products/signaling/
2.chat sdk
https://www.agora.io/en/products/chat/
Но поскольку я Я новичок в Агоре, у меня пока ничего не сделано.
`
Подробнее здесь: https://stackoverflow.com/questions/791 ... lient-side