Итак, я был немного смущен, когда увидел это:
Вот результаты для регрессии Лассо, но подобное наблюдается и во всех других моделях, даже не линейных. Таким образом, цель является бимодальной и разбила ее на кластеры, но то же самое относится и к упомянутым. Не могли бы вы помочь разобраться?
Короче, я удалил выбросы, нули, дубликаты, преобразовал категориальные значения в числовые и удалил сильно коррелированные значения. Код довольно большой, поэтому я не могу опубликовать его полностью.
Здесь информация о цели

Что это может быть и как исправить
Код Лассо регресс:
x = data.drop(['price_in_usd_log', 'price_cluster'], axis=1)
y = data['price_in_usd_log']
x_train, x_test, y_train, y_test = train_test_split(x, y,
random_state=42)
lasso_with_alpha = Lasso(alpha=0.01)
lasso_with_alpha.fit(x_train_scaled, y_train)
y_pred_lasso_with_alpha = lasso_with_alpha.predict(x_test_scaled)
plt.figure(figsize=(8, 6))
plt.scatter(y_test, y_pred_lasso_with_alpha, alpha=0.7)
plt.plot([min(y_test), max(y_test)], [min(y_test), max(y_test)], color='red', linestyle='--')
plt.title("Actual vs Predicted Values")
plt.xlabel("Actual Values")
plt.ylabel("Predicted Values")
plt.grid()
plt.show()
Подробнее здесь: https://stackoverflow.com/questions/792 ... -scattered