Дерево решений не должно быть подробным, чтобы избежать переобучения, но сколько узлов можно?
Например, у нас есть набор данных со следующей сетевой статистикой:
15 000 узлов, 180 000 ребер и 990 000 трейглов. Сколько узлов будет в порядке? Если у вас есть дерево, например, глубиной всего 2 и 6 узлов, подойдет ли оно или оно слишком маленькое? Создать дерево с тысячами узлов не проблема, а что нормально?
А какое максимальное количество узлов должно быть? Я везде читаю, что много не бывает, но что значит «не много»? Сколько допустимо в зависимости от набора данных?
Подробнее здесь: https://stackoverflow.com/questions/790 ... ut-how-man
Мобильная версия