Почему сбор входящего и исходящего звука приводит к искажению звука? - Цифровое Кемерово

Почему сбор входящего и исходящего звука приводит к искажению звука? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Гость

Почему сбор входящего и исходящего звука приводит к искажению звука?

Цитата

Сообщение Гость » 29 фев 2024, 09:41

Я пытаюсь передать аудиобайты в общий буфер и передать их через модель транскрипции. Звук поступает из веб-сокета, семплируется на частоте 8 кГц и закодирован по закону Mu-law. Мне удалось воспроизвести несколько секунд аудио для себя, если я перевожу его в отдельные отдельные аудиобуферы (ibuffer и obuffer) для входящего и исходящего звука, но если я собрать в общий буфер, звук очень медленный и задерживается. Вот выдержка из моего тестового кода:

obuffer = b"" ибуфер = б"" общий = б"" пока правда: данные = ожидание очереди.get() если данные["событие"] == "медиа": websocket_payload = данные["медиа"]["полезная нагрузка"] чанк = audioop.ulaw2lin(base64.b64decode(websocket_payload), 2) if data["media"]["track"] == ВХОДЯЩИЙ: обуфер += чанк if data["media"]["track"] == ИСХОДЯЩИЕ: ibuffer += чанк общий += чанк Я тестировал, собирая obuffer, ibuffer и shared, маринуя буферы и затем сохраняя их как .wav. файлы и воспроизводить их на своем компьютере. Отдельные буферы воспроизводятся нормально, и их даже можно объединить, просто усреднив их, что тоже работает нормально, но почему их сбор в общий буфер не может обеспечить такое же качество звука? Получаемый звук довольно далек от оригинала, и я пробовал разные частоты дискретизации до 16 кГц и т. д. Есть ли у кого-нибудь идеи, что здесь делать?

Это странно, поскольку в документации Twilio указано, что вы можете сделать это без проблем.

импортировать маринованные огурцы волна импорта с open("all_bytes.pkl", "rb") как f: loading_audio_bytes = Pickle.load(f) нканалов = 1 ширина выборки = 2 частота кадров = 8000 nframes = len(loaded_audio_bytes) // (nchannels * ширина выборки) с wave.open("wav.wav", 'wb') как wf: wf.setnchannels(нканалы) wf.setsampwidth(ширина выборки) wf.setframerate(частота кадров) wf.setnframes(nframes) wf.writeframes(loaded_audio_bytes) В этом ответе предлагается использовать только исходящую связь, но мне нужны обе дорожки!

Реклама

1709188882

Гость


Я пытаюсь передать аудиобайты в общий буфер и передать их через модель транскрипции. Звук поступает из веб-сокета, семплируется на частоте 8 кГц и закодирован по закону Mu-law. Мне удалось воспроизвести несколько секунд аудио для себя, если я перевожу его в отдельные отдельные аудиобуферы (ibuffer и obuffer) для входящего и исходящего звука, но если я собрать в общий буфер, звук очень медленный и задерживается. Вот выдержка из моего тестового кода:
 
obuffer = b"" ибуфер = б"" общий = б"" пока правда:     данные = ожидание очереди.get()     если данные["событие"] == "медиа":         websocket_payload = данные["медиа"]["полезная нагрузка"]         чанк = audioop.ulaw2lin(base64.b64decode(websocket_payload), 2)         if data["media"]["track"] == ВХОДЯЩИЙ:             обуфер += чанк         if data["media"]["track"] == ИСХОДЯЩИЕ:             ibuffer += чанк         общий += чанк  Я тестировал, собирая obuffer, ibuffer и shared, маринуя буферы и затем сохраняя их как .wav.  файлы и воспроизводить их на своем компьютере. Отдельные буферы воспроизводятся нормально, и их даже можно объединить, просто усреднив их, что тоже работает нормально, но почему их сбор в общий буфер не может обеспечить такое же качество звука? Получаемый звук довольно далек от оригинала, и я пробовал разные частоты дискретизации до 16 кГц и т. д. Есть ли у кого-нибудь идеи, что здесь делать?
 
Это странно, поскольку в документации Twilio указано, что вы можете сделать это без проблем.
 
импортировать маринованные огурцы волна импорта с open("all_bytes.pkl", "rb") как f:     loading_audio_bytes = Pickle.load(f) нканалов = 1 ширина выборки = 2 частота кадров = 8000 nframes = len(loaded_audio_bytes) // (nchannels * ширина выборки) с wave.open("wav.wav", 'wb') как wf:     wf.setnchannels(нканалы)     wf.setsampwidth(ширина выборки)     wf.setframerate(частота кадров)     wf.setnframes(nframes)     wf.writeframes(loaded_audio_bytes)  В этом ответе предлагается использовать только исходящую связь, но мне нужны обе дорожки!

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Проблема регистрации входящего и исходящего трафика WebClient

Последнее сообщение Anonymous « 21 окт 2023, 18:56
Добавлено в форуме JAVA

Anonymous » 21 окт 2023, 18:56 » в форуме JAVA

У меня проблема с WebClient. Я использую Http-интерфейс с WebClient, и мне необходимо регистрировать входящий/исходящий трафик в базу данных. Я написал этот фильтр журнала, но некоторые службы выдают NullPointerException. Я попробовал подписаться...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
21 окт 2023, 18:56
Freeswitch: Как определить, был ли ответ на звонок при перевороте входящего и исходящего звонка?

Последнее сообщение Anonymous « 28 апр 2025, 14:06
Добавлено в форуме Python

Anonymous » 28 апр 2025, 14:06 » в форуме Python

В этой реализации я пытаюсь выполнить исправление вызова между входящим вызовом и исходящим вызовом через Session.bridge () команда. В этом скрипте я пытаюсь исправить разводчик с номерами в number_list (список номеров) один за другим, пока список...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
28 апр 2025, 14:06
Перемещение последней вкладки HorizontalPager приводит к искажению

Последнее сообщение Anonymous « 05 окт 2023, 22:14
Добавлено в форуме Android

Anonymous » 05 окт 2023, 22:14 » в форуме Android

При перемещении последней вкладки HorizontalPager в Jetpack Compose представление подпрыгивает, но не возвращается в исходную форму.

Ожидается:

Результат после многократного перемещения:

Кто-нибудь сталкивался с этим раньше? Каковы...

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
05 окт 2023, 22:14
Java BufferedImage: рисование пиксельного изображения с исходным размером пикселей приводит к искажению пикселей.

Последнее сообщение Anonymous « 03 июл 2024, 09:34
Добавлено в форуме JAVA

Anonymous » 03 июл 2024, 09:34 » в форуме JAVA

Я возился с BufferedImages и хотел посмотреть, возможно ли нарисовать изображение Pixel Art в исходном размере и масштабировать его.
Прежде чем я успел изменить его размер, Я заметил, что рисование пиксельного изображения в его исходном разрешении...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 09:34
Spring Integration: обработка ошибок для исходящего адаптера Jpa

Последнее сообщение Гость « 22 сен 2023, 16:25
Добавлено в форуме JAVA

Гость » 22 сен 2023, 16:25 » в форуме JAVA

У меня есть поток интеграции Spring, который использует Jpa.inboundAdapter() в качестве источника, манипулирует прочитанными объектами в преобразовании и, наконец, сохраняет их снова с помощью Jpa.outboundAdapter.

Однако при сохранении исключений...

0 Ответы

75 Просмотры

Последнее сообщение Гость
22 сен 2023, 16:25

Вернуться в «Python»

Programmiererforum