Наблюдение: кажется, что PyAudio записывает данные иначе, чем «Звукозапись» Windows 11.Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Наблюдение: кажется, что PyAudio записывает данные иначе, чем «Звукозапись» Windows 11.

Сообщение Anonymous »

Я анализировал звуковой спектр (БПФ), издающий определенный звук («ах», как в «стоп» или «автор», но это не важно). Я записал свой голос с помощью диктофона Windows, чтобы создать обучающий набор для нейронной сети, и обучал нейронную сеть определять, какая гласная произносится. Обучение и испытания он прошел с честью. Но с живым звуком у него действительно были проблемы. Даже если бы я воспроизвел записи, на которых они обучались, и подал бы выходной сигнал динамика обратно прямо в микрофон (через стереомикс Windows), это все равно пришлось бы очень тяжело. На обучающих и тестовых данных точность составила 99 %, но на реальном аудио — только 1 % (часто казалось, что не произносится гласная).
Но после сохранения Записав свой голос с помощью pyaudio и сравнив БПФ каждого из них в Matlab (октава), я заметил, что на самом деле они совершенно разные.
Вот БПФ:
БПФ звука "ah", записанного с помощью звукозаписывающего устройства Windows 11
[img]https:/ /i.sstatic.net/zZ0E3O5n.png[/img]

БПФ «ах», записанное из Python pyaudio
Изображение

Я не уверен, в чем причина разницы. Возможно, всплеска не должно быть, и он вызван каким-то охотничьим шумом или каким-то странным найквистом/алиасингом из-за моего выбора выборки или чего-то еще. Если не считать шипа, я не уверен, почему они выглядят одинаково, но по-разному.
Если у кого-то есть идеи, в чем может быть проблема с моей ограниченной информацией, не стесняйтесь дать ответ. Но я решил, что мне следует написать сообщение, объясняющее мое наблюдение относительно несоответствий между записями pyaudio и звукозаписывающим устройством Windows 11

Подробнее здесь: https://stackoverflow.com/questions/784 ... -sound-rec
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»