Но после сохранения Записав свой голос с помощью pyaudio и сравнив БПФ каждого из них в Matlab (октава), я заметил, что на самом деле они совершенно разные.
Вот БПФ:
БПФ звука "ah", записанного с помощью звукозаписывающего устройства Windows 11
[img]https:/ /i.sstatic.net/zZ0E3O5n.png[/img]
БПФ «ах», записанное из Python pyaudio

Я не уверен, в чем причина разницы. Возможно, всплеска не должно быть, и он вызван каким-то охотничьим шумом или каким-то странным найквистом/алиасингом из-за моего выбора выборки или чего-то еще. Если не считать шипа, я не уверен, почему они выглядят одинаково, но по-разному.
Если у кого-то есть идеи, в чем может быть проблема с моей ограниченной информацией, не стесняйтесь дать ответ. Но я решил, что мне следует написать сообщение, объясняющее мое наблюдение относительно несоответствий между записями pyaudio и звукозаписывающим устройством Windows 11
Подробнее здесь: https://stackoverflow.com/questions/784 ... -sound-rec