35 эпох: точность P: 0,812, mAP50: 0,699
300 эпох: точность P: 0,852, mAP50: 0,748
750 эпох с терпением=100 (лучшая модель на эпохе 650): Точность P: 0,848, mAP50: 0,736
Для всех этих тренировок я использовал небольшую модель YOLOv9 по умолчанию со следующим кодом:
Код: Выделить всё
import os
from ultralytics import YOLO
model = YOLO("yolov9s.pt")
results = model.train(data=os.path.join(ROOT_DIR, "flickr_setup.yaml"), epochs=300, save_period=10)
Код: Выделить всё
results = model.train(
data=os.path.join("/content/gdrive/My Drive/YOLO/FlickrLogos32", "flickr_setup.yaml"),
epochs=600, # More epochs for fine-tuning
imgsz=640, # Larger image size
save_period=5,
batch=32, # Increased batch size
workers=8,
lr0=0.0025, # Lower initial learning rate
cos_lr=True, # Cosine learning rate schedule
mosaic=1,
mixup=0.1, # Reduced mixup intensity
erasing=0.3, # Reduced erasing intensity
dropout=0.2, # Increased dropout
box=5.0, # Lower box loss weight
cls=0.5, # Lower classification weight
warmup_epochs=5,
augment=True,
patience=30,
)
BoxP: 0,834
Вот показатели после обучения:
введите здесь описание изображения
Мой вопрос:
Что я могу улучшить, чтобы повысить эффективность этого тренинга? Можно ли достичь точности выше 85 % в этом наборе данных или 83–85 % — это лучшее, что я могу ожидать от FlickrLogos32?
Я был бы очень признателен за любые советы или предложения, которые вы можете предоставлять. Заранее спасибо!
Подробнее здесь: https://stackoverflow.com/questions/792 ... -with-yolo