Я создаю модель машинного обучения, которая определяет, является ли пользователь ботом или нет. Я использовал seaborn для построения парного графика и понял, что большая часть данных перекрывается. Ниже приведен код, который я написал для стандартизации, разделения и развертывания модели. Изображение показывает, как модель работает с чуть более чем 40 000 выборками. Как вы можете видеть, модель строит предположения, и я пытаюсь выяснить, почему это так.
Я создаю модель машинного обучения, которая определяет, является ли пользователь ботом или нет. Я использовал seaborn для построения парного графика и понял, что большая часть данных перекрывается. Ниже приведен код, который я написал для стандартизации, разделения и развертывания модели. Изображение показывает, как модель работает с чуть более чем 40 000 выборками. Как вы можете видеть, модель строит предположения, и я пытаюсь выяснить, почему это так.
[img]https://i.sstatic.net/pjM9Iyfg.png[/img]
[code] X = new_df[['Retweet Count', 'Mention Count', 'Follower Count', 'Tweet', 'Hashtags', 'Verified', 'Created At']] y = new_df[['Bot Label']].values
y = y.ravel() # Ensuring that y is 1D array instead of a 2D array
Я создаю модель машинного обучения, которая определяет, является ли пользователь ботом или нет. Я использовал seaborn для построения парного графика и понял, что большая часть данных перекрывается. Ниже приведен код, который я написал для...
Я создаю модель машинного обучения, которая определяет, является ли пользователь ботом или нет. Я использовал seaborn для построения парного графика и понял, что большая часть данных перекрывается. Ниже приведен код, который я написал для...
Моя цель — выполнить регрессию на основе набора данных, поступающих из «реального мира» (датчиков).
Данные представлены в табличном формате. Есть 6 независимых функций с очень разными значениями (необходимо масштабирование). Кроме того, зависимая...
Я разработчик Python с опытом работы с веб-фреймворками Python, такими как Django, Flask и FastAPI. Я считаю себя полнофункциональным специалистом, поскольку владею React и умею развертывать приложения на различных платформах. Изначально я выбрал...
Последнее сообщение
import psycopg2
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.model_selection import train_test_split
from sklearn.metrics import silhouette_score, classification_report, confusion_matrix
from sklearn.preprocessing import...
У меня есть набор данных с 96 объектами. У меня в метках 90 числовых функций: 6 классов и 6 категориальных. Во-первых, я хочу сделать выбор признаков путем расчета корреляции, но будет ли правильно, если я выполню категориальные функции отдельно с...