Как бороться с перекрывающимися данными в машинном обученииPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как бороться с перекрывающимися данными в машинном обучении

Сообщение Anonymous »

Я создаю модель машинного обучения, которая определяет, является ли пользователь ботом или нет. Я использовал seaborn для построения парного графика и понял, что большая часть данных перекрывается. Ниже приведен код, который я написал для стандартизации, разделения и развертывания модели. Изображение показывает, как модель работает с чуть более чем 40 000 выборками. Как вы можете видеть, модель работает на догадках, и я пытаюсь выяснить, почему это так.
[img]https:/ /i.sstatic.net/pjM9Iyfg.png[/img]

Код: Выделить всё

X = new_df[['Retweet Count', 'Mention Count', 'Follower Count', 'Tweet', 'Hashtags', 'Verified', 'Created At']]
y = new_df[['Bot Label']].values

y = y.ravel() # Ensuring that y is 1D array instead of a 2D array

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)

Scaler = StandardScaler()
X_train_scaled = Scaler.fit_transform(X_train)
X_test_scaled = Scaler.transform(X_test)

from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import make_classification
from sklearn.metrics import confusion_matrix

rfc = RandomForestClassifier(n_estimators = 1000)
rfc.fit(X_train_scaled, y_train)
y_pred = rfc.predict(X_test_scaled)
print(classification_report(y_test, y_pred))
print(confusion_matrix(y_test, y_pred))
Изображение


Подробнее здесь: https://stackoverflow.com/questions/791 ... e-learning
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение
  • Как бороться с перекрывающимися данными в машинном обучении
    Anonymous » » в форуме Python
    0 Ответы
    7 Просмотры
    Последнее сообщение Anonymous
  • Как бороться с перекрывающимися данными в машинном обучении
    Anonymous » » в форуме Python
    0 Ответы
    11 Просмотры
    Последнее сообщение Anonymous
  • Как обращаться с «реальными» данными и замкнутыми уравнениями в машинном обучении?
    Anonymous » » в форуме Python
    0 Ответы
    25 Просмотры
    Последнее сообщение Anonymous
  • Вопросы об машинном обучении и искусственном интеллекте
    Anonymous » » в форуме Python
    1 Ответы
    38 Просмотры
    Последнее сообщение Lola987
  • Анализ большого количества функций в машинном обучении
    Гость » » в форуме Python
    0 Ответы
    24 Просмотры
    Последнее сообщение Гость

Вернуться в «Python»