Twilio воспроизводит только белый шум при попытке потоковой передачи звука

Twilio воспроизводит только белый шум при попытке потоковой передачи звука ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Twilio воспроизводит только белый шум при попытке потоковой передачи звука

Цитата

Сообщение Anonymous » 17 окт 2024, 18:59

Я пытаюсь передать аудио, сгенерированное ElevenLabs (через их веб-сокет), обратно в Twilio. Однако я мог слышать только белый шум.
Однако, когда я использовал их API для получения звука, открыл его и передал в twilio, он воспроизводился на телефоне правильно. .
Ниже приведен мой код, в котором я пытаюсь сгенерировать звук из одиннадцати лабораторий, а затем отправить его в свой сокет twilio.

Код: Выделить всё

async def text_to_speech_stream(text: str):
voice_id = "pNInz6obpgDQGcFmaJgB"
model_id = "eleven_multilingual_v2"

# Construct the WebSocket URL
url = f"wss://api.elevenlabs.io/v1/text-to-speech/{voice_id}/stream-input?model_id={model_id}"

# Set up headers
headers = {
'xi-api-key': ""
}

# Payload to send
payload = {
"text": " ",
"voice_settings": {
"stability": 0.0,
"similarity_boost": 1.0,
"style": 0.0,
"use_speaker_boost": True
},
"model_id": model_id,
"voice_id": voice_id,
"xi-api-key": "",
"output_format": "ulaw_8000",
"flush":True
}

async with websockets.connect(url) as ws:
print("websocket connected: 11labs")
# Send the payload as JSON
await ws.send(json.dumps(payload))
await ws.send(json.dumps({"text":text}))
await ws.send(json.dumps({"text": ""}))

# Receive audio chunks
start_time = time.time()
print("waiting for revecivng")
print()
audio_buffer = bytearray()
while True:
try:
message = await ws.recv()
data = json.loads(message)
if data.get("audio"):
# Audio chunk received
print("yielded in: ",time.time()-start_time, flush=True)

yield data["audio"]#base64.b64decode(data["audio"])

elif data.get('isFinal'):
break

elif isinstance(message, str):
# Text message received (e.g., errors or status updates)
data = json.loads(message)
if data.get("warning"):
print(f"Warning: {data['warning']}")
elif data.get("error"):
print(f"Error: {data['error']}")
break
else:
print(f"Message from ElevenLabs: ")
else:
print("Unknown message type received")
except websockets.exceptions.ConnectionClosedOK:
# Connection closed gracefully
break
except Exception as e:
print(f"Error in ElevenLabs WebSocket: {e}")
break

async def send_to_twilio_eleven(websocket, message, stream_sid, interruption_event):
print("Starting TTS streaming from ElevenLabs")
try:
start_time = time.time()
print("message is: ", message)
audio_payload = ""
count = 0
# audio_payload = text_to_speech_stream(message) # for API

async for audio_chunk in text_to_speech_stream(message):
print("Chunk yielded in : ",time.time()-start_time)
# Trying to buffer.  Facing same issue even when streamed directly without buffering
audio_payload += audio_chunk

# Construct the message to send to Twilio
audio_delta = {
"event": "media",
"streamSid": stream_sid,
"media": {
"payload": audio_payload
}
}

# ideal for sending chunks
if interruption_event.is_set():
print("Interruption detected")
return

# Send the message to Twilio
await websocket.send_json(audio_delta)
print("received audio sent to twilio")

# Yield control to the event loop
await asyncio.sleep(0)

except Exception as e:
print(f"Error in send_to_twilio_eleven: {e}")

Что-то я делаю неправильно при получении звука от ElevenLabs или перед его отправкой в twilio?

Подробнее здесь: https://stackoverflow.com/questions/790 ... ream-audio

1729180760

Anonymous

Я пытаюсь передать аудио, сгенерированное ElevenLabs (через их веб-сокет), обратно в Twilio. Однако я мог слышать только белый шум.
Однако, когда я использовал их API для получения звука, открыл его и передал в twilio, он воспроизводился на телефоне правильно. .
Ниже приведен мой код, в котором я пытаюсь сгенерировать звук из одиннадцати лабораторий, а затем отправить его в свой сокет twilio.
[code]async def text_to_speech_stream(text: str):
voice_id = "pNInz6obpgDQGcFmaJgB"
model_id = "eleven_multilingual_v2"

# Construct the WebSocket URL
url = f"wss://api.elevenlabs.io/v1/text-to-speech/{voice_id}/stream-input?model_id={model_id}"

# Set up headers
headers = {
'xi-api-key': ""
}

# Payload to send
payload = {
"text": " ",
"voice_settings": {
"stability": 0.0,
"similarity_boost": 1.0,
"style": 0.0,
"use_speaker_boost": True
},
"model_id": model_id,
"voice_id": voice_id,
"xi-api-key": "",
"output_format": "ulaw_8000",
"flush":True
}

async with websockets.connect(url) as ws:
print("websocket connected: 11labs")
# Send the payload as JSON
await ws.send(json.dumps(payload))
await ws.send(json.dumps({"text":text}))
await ws.send(json.dumps({"text": ""}))

# Receive audio chunks
start_time = time.time()
print("waiting for revecivng")
print()
audio_buffer = bytearray()
while True:
try:
message = await ws.recv()
data = json.loads(message)
if data.get("audio"):
# Audio chunk received
print("yielded in: ",time.time()-start_time, flush=True)

yield data["audio"]#base64.b64decode(data["audio"])

elif data.get('isFinal'):
break

elif isinstance(message, str):
# Text message received (e.g., errors or status updates)
data = json.loads(message)
if data.get("warning"):
print(f"Warning: {data['warning']}")
elif data.get("error"):
print(f"Error: {data['error']}")
break
else:
print(f"Message from ElevenLabs: ")
else:
print("Unknown message type received")
except websockets.exceptions.ConnectionClosedOK:
# Connection closed gracefully
break
except Exception as e:
print(f"Error in ElevenLabs WebSocket: {e}")
break

async def send_to_twilio_eleven(websocket, message, stream_sid, interruption_event):
print("Starting TTS streaming from ElevenLabs")
try:
start_time = time.time()
print("message is: ", message)
audio_payload = ""
count = 0
# audio_payload = text_to_speech_stream(message) # for API

async for audio_chunk in text_to_speech_stream(message):
print("Chunk yielded in : ",time.time()-start_time)
# Trying to buffer.  Facing same issue even when streamed directly without buffering
audio_payload += audio_chunk

# Construct the message to send to Twilio
audio_delta = {
"event": "media",
"streamSid": stream_sid,
"media": {
"payload": audio_payload
}
}

# ideal for sending chunks
if interruption_event.is_set():
print("Interruption detected")
return

# Send the message to Twilio
await websocket.send_json(audio_delta)
print("received audio sent to twilio")

# Yield control to the event loop
await asyncio.sleep(0)

except Exception as e:
print(f"Error in send_to_twilio_eleven: {e}")
[/code]
Что-то я делаю неправильно при получении звука от ElevenLabs или перед его отправкой в twilio? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79069684/twilio-playing-only-white-noise-while-trying-to-stream-audio[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Twilio воспроизводит только белый шум при попытке потоковой передачи звука

Последнее сообщение Anonymous « 09 окт 2024, 13:08
Добавлено в форуме Python

Anonymous » 09 окт 2024, 13:08 » в форуме Python

Я пытаюсь передать аудио, сгенерированное ElevenLabs (через их веб-сокет), обратно в Twilio. Однако я мог слышать только белый шум.
Однако, когда я использовал их API для получения звука, открыл его и передал в twilio, он воспроизводился на телефоне...

0 Ответы

31 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 13:08
Twilio воспроизводит только белый шум при попытке потоковой передачи звука

Последнее сообщение Anonymous « 10 окт 2024, 19:01
Добавлено в форуме Python

Anonymous » 10 окт 2024, 19:01 » в форуме Python

Я пытаюсь передать аудио, сгенерированное ElevenLabs (через их веб-сокет), обратно в Twilio. Однако я мог слышать только белый шум.
Однако, когда я использовал их API для получения звука, открыл его и передал в twilio, он воспроизводился на телефоне...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
10 окт 2024, 19:01
Любая сторонняя библиотека для потоковой передачи звука на внутренний сервер [закрыто]

Последнее сообщение Anonymous « 10 май 2024, 22:58
Добавлено в форуме Android

Anonymous » 10 май 2024, 22:58 » в форуме Android

Мы создаем собственное приложение для iOS и Android, которое должно передавать потоковое аудио и отправлять его на наш серверный сервер. Запись и загрузка звука должны поддерживаться в автономном режиме, чтобы пользователи могли записывать, даже...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
10 май 2024, 22:58
Любая сторонняя библиотека для потоковой передачи звука на внутренний сервер [закрыто]

Последнее сообщение Anonymous « 10 май 2024, 22:58
Добавлено в форуме IOS

Anonymous » 10 май 2024, 22:58 » в форуме IOS

Мы создаем собственное приложение для iOS и Android, которое должно передавать потоковое аудио и отправлять его на наш серверный сервер. Запись и загрузка звука должны поддерживаться в автономном режиме, чтобы пользователи могли записывать, даже...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
10 май 2024, 22:58
Использование PipeStream для передачи потока ответов для ведения журнала без потери эффекта потоковой передачи для конеч

Последнее сообщение Anonymous « 03 май 2024, 06:06
Добавлено в форуме C#

Anonymous » 03 май 2024, 06:06 » в форуме C#

У меня есть конечная точка, которая передает List как IAsyncEnumerable в ответе, и поэтому при использовании в браузере ответ загружается с эффектом потоковой передачи по мере записи данных в поток ответа.
Теперь у меня также есть сквозное...

0 Ответы

90 Просмотры

Последнее сообщение Anonymous
03 май 2024, 06:06

Вернуться в «Python»