Я хочу создать модель прогнозирования, которая сможет предсказать исход футбольного матча до его начала. Цель состоит в том, чтобы предсказать:
Точные результаты счета (например, 1–0, 1–1, 2–1, 1–2 и т. д.)
Вероятности победы/ничьи/проигрыша
Вероятности для конкретной команды (% побед дома, % побед на выезде, ничья) %)
Я был бы признателен за советы от всех, кто работал над чем-то подобным, особенно по следующим вопросам:
Подход к моделированию
Какие алгоритмы обычно используются для решения этой задачи?
(например, регрессия Пуассона, двумерный метод Пуассона, XGBoost, нейронные сети, байесовские модели и т. д.)
Как вы обычно комбинируете прогнозирование очков с вероятностями победы/ничей/проигрыша?
Функции
Часто используемые входные функции (сила команды, недавняя форма, xG, домашняя страница) преимущество, травмы, шансы и т. д.)
Как обрабатывать категориальные данные, такие как команды и лиги
Наборы данных
Общедоступные наборы данных, обычно используемые для прогнозирования футбольных матчей
Типичный размер набора данных (количество матчей/сезонов)
Любые рекомендуемые источники (например, Kaggle, FBref, Understat, Football-Data и т. д.)
Оценка
Метрики, используемые для оценки прогнозов оценок по сравнению с вероятностью результата.
Распространенные ошибки, которых следует избегать (переоснащение, утечка данных, дрейф концепций)
Существующие инструменты или проекты с открытым исходным кодом
Ссылки на GitHub репозитории, статьи или блоги, в которых объясняется, как создаются такие модели.
Я открыт для использования традиционных подходов ML, глубокого обучения или искусственного интеллекта. Любые советы, примеры и рекомендации будут очень полезны.
Заранее спасибо!
Я хочу создать модель прогнозирования, которая сможет предсказать исход футбольного матча до его начала. Цель состоит в том, чтобы предсказать: [list] [*]Точные результаты счета (например, 1–0, 1–1, 2–1, 1–2 и т. д.)
[*]Вероятности победы/ничьи/проигрыша
[*]Вероятности для конкретной команды (% побед дома, % побед на выезде, ничья) %)
[/list] Я был бы признателен за советы от всех, кто работал над чем-то подобным, особенно по следующим вопросам: [list] [*][b]Подход к моделированию[/b] [list] Какие алгоритмы обычно используются для решения этой задачи?
(например, регрессия Пуассона, двумерный метод Пуассона, XGBoost, нейронные сети, байесовские модели и т. д.)
[*]Как вы обычно комбинируете прогнозирование очков с вероятностями победы/ничей/проигрыша?
[/list]
[*][b]Функции[/b] [list] Часто используемые входные функции (сила команды, недавняя форма, xG, домашняя страница) преимущество, травмы, шансы и т. д.)
[*]Как обрабатывать категориальные данные, такие как команды и лиги
[/list]
[*][b]Наборы данных[/b] [list] Общедоступные наборы данных, обычно используемые для прогнозирования футбольных матчей
[*]Типичный размер набора данных (количество матчей/сезонов)
[*]Любые рекомендуемые источники (например, Kaggle, FBref, Understat, Football-Data и т. д.)
[/list]
[*][b]Оценка[/b] [list] Метрики, используемые для оценки прогнозов оценок по сравнению с вероятностью результата.
[*]Распространенные ошибки, которых следует избегать (переоснащение, утечка данных, дрейф концепций)
[/list]
[*][b]Существующие инструменты или проекты с открытым исходным кодом[/b] [list] Ссылки на GitHub репозитории, статьи или блоги, в которых объясняется, как создаются такие модели. [/list]
[/list] Я открыт для использования традиционных подходов ML, глубокого обучения или искусственного интеллекта. Любые советы, примеры и рекомендации будут очень полезны. Заранее спасибо!