RF всегда переоснащается для моих линейных данных. Я попробовал оптимизацию гиперпараметров.
из sklearn.model_selection import train_test_split, RandomizedSearchCV
Daten=1000
Я смоделировал набор данных с линейной зависимостью. Процесс генерации данных включает в себя определение точки пересечения и коэффициентов для шести признаков, генерацию данных признаков с использованием многомерного нормального распределения и вычисление целевой переменной с добавленным случайным шумом. Несмотря на использование GridSearchCV для оптимизации гиперпараметров, модель RF показывает высокие оценки R2 в обучающих данных, но низкие оценки R2 в тестовых данных, что указывает на переобучение.
RF всегда переоснащается для моих линейных данных. Я попробовал оптимизацию гиперпараметров. Это общая проблема? [code] intercept=2 subscript_numbers = ['\u2081', '\u2082', '\u2083', '\u2084', '\u2085', '\u2086'] column_names = [f'x{subscript_numbers[i]}' for i in range(6)] coefficients = np.array([1.5, -0.5, -1.5, 1.0, 0.0, 0.0])
for seed in range(n_simulations): np.random.seed(seed) X = np.random.multivariate_normal(np.zeros(6), cov_matrix, size=Daten) y = intercept + np.dot(X, coefficients) + np.random.randn(Daten)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=seed)
[/code] Я смоделировал набор данных с линейной зависимостью. Процесс генерации данных включает в себя определение точки пересечения и коэффициентов для шести признаков, генерацию данных признаков с использованием многомерного нормального распределения и вычисление целевой переменной с добавленным случайным шумом. Несмотря на использование GridSearchCV для оптимизации гиперпараметров, модель RF показывает высокие оценки R2 в обучающих данных, но низкие оценки R2 в тестовых данных, что указывает на переобучение.
Я пробовал использовать все переменные, а не выбирать определенные переменные, однако MSE остается высоким. Вместо этого мне интересно, не ошибка ли это в моем коде. Я также пытался добавить некоторые инженерные функции, но пока закомментировал это,...
Я работал над моделью случайного леса, чтобы прогнозировать отток сотрудников. Мой набор данных сильно несбалансирован: около 80% случаев не истощения и 20% случаев истощения. Хотя я попробовал SMOTE для балансировки классов, точность моей модели...
Я работал над моделью случайного леса, чтобы прогнозировать отток сотрудников. Мой набор данных сильно несбалансирован: около 80% случаев не истощения и 20% случаев истощения. Хотя я попробовал SMOTE для балансировки классов, точность моей модели...
У меня есть модель, использующая случайный лес, разработанная на Python. Теперь я хочу использовать эту обученную сеть в Matlab. Как перенести обученную сеть с Python на Matlab. Может кто-нибудь, пожалуйста, дайте мне знать, как это сделать?
Я...
У меня есть модель, обученная на моих данных. Я использовал joblib, чтобы получить модель, и поделился ею с другими командами, чтобы оценить производительность модели на их данных. Один из членов команды вернулся и сказал, что модели не очень хорошо...