Модель (Yolov1) написана на PyTorch. Было обучено 30 эпох, для обучения использовался AdamOptimazer, скорость обучения = 1e-6, пакет_размер = 64. Плотный набор данных DeepScoresV2: в обучающей выборке 1362 фотографии, из набора данных я беру только 3 класса. Но модель возвращает один и тот же результат для всех фотографий. В чем может быть проблема?
Задача — определить нотную запись на нотном листе, а также найти специальные знаки (награду и ключи).
Пример (в пустые ячейки, это ошибка функции, выводящей изображение, в самом наборе данных все нормально):
пример
Распределение классов в обучающей выборке (я беру только «подпорка», 'staff' и 'ottavaBracket' из них):
классы
Архитектура модели:
Модель (Yolov1) написана на PyTorch. Было обучено 30 эпох, для обучения использовался AdamOptimazer, скорость обучения = 1e-6, пакет_размер = 64. Плотный набор данных DeepScoresV2: в обучающей выборке 1362 фотографии, из набора данных я беру только 3 класса. Но модель возвращает один и тот же результат для всех фотографий. В чем может быть проблема? Задача — определить нотную запись на нотном листе, а также найти специальные знаки (награду и ключи). Пример (в пустые ячейки, это ошибка функции, выводящей изображение, в самом наборе данных все нормально): пример Распределение классов в обучающей выборке (я беру только «подпорка», 'staff' и 'ottavaBracket' из них): классы Архитектура модели: [code]class ConvCombo(nn.Module): def __init__(self, in_channels: int, out_channels: int, kernel_size: int, stride: int = 1, padding=1): super().__init__() self._stack = nn.Sequential( nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=kernel_size, stride=stride, padding=padding, bias=False), # nn.BatchNorm2d(out_channels), nn.LeakyReLU(0.1), ) def forward(self, x): return self._stack(x)