Я пытаюсь создать приложение для ручной коррекции высоты тона.

Я пытаюсь создать приложение для ручной коррекции высоты тона. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Я пытаюсь создать приложение для ручной коррекции высоты тона.

Цитата

Сообщение Anonymous » 08 янв 2025, 18:57

Обнаружение высоты звука, вероятно, обнаруживает либо слишком мелкие детали, либо вообще не обнаруживает правильно, поскольку код должен отображать случайную цветную форму сигнала всякий раз, когда в звуке происходит резкое изменение высоты звука. Но это должна быть проблема в коде, потому что я видел библиотеку crepe в действии, которая работает феноменально хорошо, когда дело доходит до определения высоты тона.

Код: Выделить всё

import sys
import numpy as np
import soundfile as sf
from PyQt6.QtWidgets import (
QApplication, QMainWindow, QPushButton, QVBoxLayout, QWidget, QFileDialog, QLabel
)
from PyQt6.QtCore import Qt
from matplotlib.backends.backend_qt5agg import FigureCanvasQTAgg as FigureCanvas
from matplotlib.figure import Figure
from crepe import predict
from io import BytesIO
from pydub import AudioSegment
from matplotlib.widgets import Slider

# Function to calculate the closest musical note frequency
def closest_note_frequency(freq):
A4 = 440.0
semitone_ratio = 2 ** (1 / 12)
if freq  0 and confidence[i] > 0.8:
current_note = closest_note_frequency(frequency[i])
prev_note = closest_note_frequency(frequency[i - 1])
if abs(current_note - prev_note) > abs(current_note * (2 ** (1 / 12) - 1)):
pitch_changes.append(i)

# Chop audio into segments based on pitch changes
self.segments = []
self.segment_colors = []
start = 0

for change in pitch_changes:
end = change
self.store_segment(start, end)
start = end

# Add the last segment
self.store_segment(start, len(self.audio_data))

# Display waveform
self.display_waveform()

def store_segment(self, start, end):
# Convert segment to bytes and store in memory
segment = self.audio_data[start:end]
self.segments.append(segment)
# Generate a random color for this segment
color = (np.random.rand(), np.random.rand(), np.random.rand())  # RGB tuple
self.segment_colors.append(color)

def display_waveform(self):
viewer = WaveformViewer(self.segments, self.segment_colors, self.sample_rate)
self.layout.addWidget(viewer)

if __name__ == "__main__":
app = QApplication(sys.argv)
window = PitchChangeDetector()
window.show()
sys.exit(app.exec())

Я попробовал изменить порог следующим образом:

Код: Выделить всё

if abs(current_note - prev_note) > abs(current_note * (2 ** (1 / 12) - 1)):

на это:

Код: Выделить всё

if abs(current_note - prev_note) > 10:

Но результаты те же...
Я не использовал отладчик. Я использовал этот аудиофайл:drive.google.com/file/d/1Eb5OiWgl6RVFM7Jqv-AF--vDdRjPuH8T/… (Этот аудиофайл был создан мной, я использовал 17 нот разной высоты, поэтому аудиовизуализация должна иметь 17 случайных цветов. ) Результат оказался почти идеальным, как и предполагалось, приложение показывало форму сигнала, но цвета не были назначены нужным позициям формы сигнала.

Подробнее здесь: https://stackoverflow.com/questions/793 ... pplication

1736351822

Anonymous

Обнаружение высоты звука, вероятно, обнаруживает либо слишком мелкие детали, либо вообще не обнаруживает правильно, поскольку код должен отображать случайную цветную форму сигнала всякий раз, когда в звуке происходит резкое изменение высоты звука.  Но это должна быть проблема в коде, потому что я видел библиотеку [b]crepe[/b] в действии, которая работает феноменально хорошо, когда дело доходит до определения высоты тона.
[code]import sys
import numpy as np
import soundfile as sf
from PyQt6.QtWidgets import (
QApplication, QMainWindow, QPushButton, QVBoxLayout, QWidget, QFileDialog, QLabel
)
from PyQt6.QtCore import Qt
from matplotlib.backends.backend_qt5agg import FigureCanvasQTAgg as FigureCanvas
from matplotlib.figure import Figure
from crepe import predict
from io import BytesIO
from pydub import AudioSegment
from matplotlib.widgets import Slider

# Function to calculate the closest musical note frequency
def closest_note_frequency(freq):
A4 = 440.0
semitone_ratio = 2 ** (1 / 12)
if freq  0 and confidence[i] > 0.8:
current_note = closest_note_frequency(frequency[i])
prev_note = closest_note_frequency(frequency[i - 1])
if abs(current_note - prev_note) > abs(current_note * (2 ** (1 / 12) - 1)):
pitch_changes.append(i)

# Chop audio into segments based on pitch changes
self.segments = []
self.segment_colors = []
start = 0

for change in pitch_changes:
end = change
self.store_segment(start, end)
start = end

# Add the last segment
self.store_segment(start, len(self.audio_data))

# Display waveform
self.display_waveform()

def store_segment(self, start, end):
# Convert segment to bytes and store in memory
segment = self.audio_data[start:end]
self.segments.append(segment)
# Generate a random color for this segment
color = (np.random.rand(), np.random.rand(), np.random.rand())  # RGB tuple
self.segment_colors.append(color)

def display_waveform(self):
viewer = WaveformViewer(self.segments, self.segment_colors, self.sample_rate)
self.layout.addWidget(viewer)

if __name__ == "__main__":
app = QApplication(sys.argv)
window = PitchChangeDetector()
window.show()
sys.exit(app.exec())
[/code]
Я попробовал изменить порог следующим образом:
[code]if abs(current_note - prev_note) > abs(current_note * (2 ** (1 / 12) - 1)):
[/code]
на это:
[code]if abs(current_note - prev_note) > 10:
[/code]
Но результаты те же...
Я не использовал отладчик. Я использовал этот аудиофайл:drive.google.com/file/d/1Eb5OiWgl6RVFM7Jqv-AF--vDdRjPuH8T/… (Этот аудиофайл был создан мной, я использовал 17 нот разной высоты, поэтому аудиовизуализация должна иметь 17 случайных цветов. ) Результат оказался почти идеальным, как и предполагалось, приложение показывало форму сигнала, но цвета не были назначены нужным позициям формы сигнала. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79339911/im-trying-to-make-a-manual-pitch-correction-application[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Реализация обнаружения высоты тона TarsoSDSP: внезапные падения высоты тона после выпуска ноты с FFT_YIN

Последнее сообщение Anonymous « 25 июл 2025, 13:38
Добавлено в форуме Android

Anonymous » 25 июл 2025, 13:38 » в форуме Android

введение
Я строю приложение для обнаружения шага в реальном времени в Kotlin/Android с использованием Tarsosdsp. Приложение захватывает аудио вход, обнаруживает фундаментальную частоту с использованием алгоритма FFT_YIN, и отображает результат на...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
25 июл 2025, 13:38
Как исправить переворот высоты тона/взгляда при повороте тональности более чем на 90 градусов?

Последнее сообщение Anonymous « 16 мар 2024, 20:27
Добавлено в форуме C++

Anonymous » 16 мар 2024, 20:27 » в форуме C++

Я следил за серией руководств LearnOpenGL и дошел до раздела, посвященного камере, и пока они настраивали камеру для полета, я пытался адаптировать ее для камеры в стиле FPS. Обычно это работает нормально, но всякий раз, когда я пытаюсь посмотреть...

0 Ответы

51 Просмотры

Последнее сообщение Anonymous
16 мар 2024, 20:27
Мне нужно отлаживать свой синтаксис, чтобы найти ошибки. Я все еще пытаюсь понять концепцию отладки и коррекции ошибок в

Последнее сообщение Anonymous « 16 фев 2025, 05:28
Добавлено в форуме Python

Anonymous » 16 фев 2025, 05:28 » в форуме Python

Я новичок в отладке, и мне понадобится помощь с определением ошибок, обнаруженных в синтаксисе ниже;
ans1 = []

ans2 = None

def counter(L):

b=[]

summ = 0

prev_element = 0

for element in L:

summ = prev_element + element

prev_element =...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
16 фев 2025, 05:28
Мне нужно отлаживать свой синтаксис, чтобы найти ошибки. Я все еще пытаюсь понять концепцию отладки и коррекции ошибок в

Последнее сообщение Anonymous « 16 фев 2025, 09:08
Добавлено в форуме Python

Anonymous » 16 фев 2025, 09:08 » в форуме Python

Я новичок в отладке, и мне понадобится помощь с определением ошибок, обнаруженных в синтаксисе ниже;
ans1 = []
ans2 = None

def counter(L):
b = []
summ = 0
prev_element = 0
for element in L:
summ = prev_element + element
prev_element = element...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
16 фев 2025, 09:08
Я новичок, пытаюсь использовать ручной способ перетаскивания, как в игре kivy. Я хочу попробовать создать, используя обы

Последнее сообщение Гость « 24 сен 2023, 10:45
Добавлено в форуме Python

Гость » 24 сен 2023, 10:45 » в форуме Python

Я создаю класс поля и класс карты. Я достиг карточного класса, позволяющего перетаскивать карту на поле и бросать ее. Но я также хочу иметь возможность перемещать и изменять положение карточек внутри поля, пока не будут соединены три одинаковые...

0 Ответы

103 Просмотры

Последнее сообщение Гость
24 сен 2023, 10:45

Вернуться в «Python»