Конфигурация тонкой настройки звука для небольшого набора данныхPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Конфигурация тонкой настройки звука для небольшого набора данных

Сообщение Anonymous »

Я новичок в обучении данных, особенно в области точной настройки. Я хочу попробовать сделать точную настройку аудиоданных с помощью витов с небольшим набором данных под 100 аудиофайлов по 10 с каждый, и вот в чем проблема, я уже пробовал использовать несколько кейсов типа настройки
  • Эпоха
  • Размер пакета
  • Скорость обучения
  • Бета< /li>
    Разминка Эпохи
  • Мел Обрабатывает данные
но почему-то это все еще не дает желаемого результата. Я прочитал документацию, и там сказано, что установка эпохи около 600-1000 может дать хороший результат, но в моем случае это все еще не так. Я пытался тренировать около 4 дней несколько случаев:
1-й:
  • примечания: я впервые занимаюсь точной настройкой проекта.
  • размер пакета: 16.
  • период: 200.
  • время: ~20 минут
  • результат: I слышал много машинных голосов, некоторые голоса улавливаются правильно, но слишком тихие, чтобы их можно было заметить, если не сосредоточиться на них
2-й:< /strong>
  • примечания: я прочитал несколько статей, кажется, что меньшая партия может дать более точный результат для небольшого размера данных и для нужной мне эпохи чтобы не переусердствовать, поэтому я попытался реализовать это здесь
  • размер пакета: 8
  • эпоха: 300
  • время: ~30 минут
  • результат: используя этот подход, я начал слышать какой-то голос, хотя в нем все еще много машинного шаблона, но начал прояснять этот случай

3-е:
  • примечания: Основываясь на результатах второго случая, я думаю, что увеличение эпохи может дать лучший результат, поскольку диапазон широк, поэтому в этом случае я попытался следовать рекомендуемой конфигурации (16 пакетов и 10 000 эпох). ), но попробуйте уменьшить эпоху.
  • размер пакета: 8.
  • эпоха: 3000.
  • время: ~8-9 часов
  • результат: почему-то в этом результате он начинает звучать как не машинный, примерно 25%, так что, возможно, увеличение размера пакета может помочь, если я тоже захочу добавить эпоху.
4-е:
  • примечания: исходя из последних случаев, я пробовал добавить размер партии, так как моя спецификация не так уж и плоха (дополнительную информацию я дам ниже). раздел)
  • размер пакета: 16
  • эпоха: 4000
  • время: ~7-8 часов< /li>
    результат: в этом случае звук почему-то становится очень странным и производительность снижается
на основе этого , хочу спросить, как мне правильно рассчитать стоимость своих тренировок, чтобы получить хотя бы достойный результат? Я немного смущен, когда делаю свою первую тонкую настройку.
Что касается моей спецификации ПК, вот она:

NVidia RTX 3060, 12 ГБ DDR6, 64 ГБ ОЗУ и Intel I7-12700F 12-го поколения

Однажды я попробовал получить лучшее конфигурация для моей установки из GPT, но почему-то результат тот же, он дает этот параметр:

Код: Выделить всё

  "train": {
"log_interval": 50,
"eval_interval": 200,
"seed": 1234,
"epochs": 1000,
"learning_rate": 1e-4,
"betas": [0.9, 0.98],
"eps": 1e-9,
"batch_size": 4,
"fp16_run": true,
"lr_decay": 0.9999,
"segment_size": 8192,
"init_lr_ratio": 1,
"warmup_epochs": 5,
"c_mel": 30,
"c_kl": 1.0
}
в конфигурации репозитория по умолчанию это выглядит так:

Код: Выделить всё

  "train": {
"log_interval": 200,
"eval_interval": 1000,
"seed": 1234,
"epochs": 10000,
"learning_rate": 2e-5,
"betas": [0.8, 0.99],
"eps": 1e-9,
"batch_size": 16,
"fp16_run": true,
"lr_decay": 0.999875,
"segment_size": 8192,
"init_lr_ratio": 1,
"warmup_epochs": 0,
"c_mel": 45,
"c_kl": 1.0
}
Итак, вот несколько вопросов, которые я хочу задать:
Есть ли какие-либо рекомендации для моей точной настройки конфигурации для аудиофайлы с набором данных менее 100 и должен ли максимальный размер пакета всегда быть меньше общего количества выборочных данных?

Подробнее здесь: https://stackoverflow.com/questions/791 ... l-data-set
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Конфигурация тонкой настройки звука для небольшого набора данных
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous
  • Нахождение жесткого 2D-преобразования небольшого набора
    Anonymous » » в форуме C++
    0 Ответы
    4 Просмотры
    Последнее сообщение Anonymous
  • Проблемы во время тонкой настройки LoRA: получены неожиданные аргументы: {'num_items_in_batch': 8192}
    Anonymous » » в форуме Python
    0 Ответы
    26 Просмотры
    Последнее сообщение Anonymous
  • Проблемы во время тонкой настройки LoRA: получены неожиданные аргументы: {'num_items_in_batch': 8192}
    Anonymous » » в форуме Python
    0 Ответы
    23 Просмотры
    Последнее сообщение Anonymous
  • Ошибка тонкой настройки GPT-3: предоставлен неверный ключ API.
    Anonymous » » в форуме Python
    0 Ответы
    17 Просмотры
    Последнее сообщение Anonymous

Вернуться в «Python»