импортировать ОС os.environ['LOKY_MAX_CPU_COUNT'] = '6' импортировать pandas**strong text** как из sklearn.preprocessing импорт StandardScaler из sklearn.neighbours импортировать KNeighboursClassifier из sklearn.metrics импорт точности_score из sklearn.impute импорт SimpleImputer из sklearn.metrics импорт классификационный_отчет egitim_data = pd.read_excel(r'C:\Users\memo3\OneDrive\Masaustü\ZSCOREEGITIMDATA.xlsx') test_data = pd.read_excel(r'C:\Users\memo3\OneDrive\Masaustü\ZSCORETESTDATA.xlsx') print("Значения NaN в обучающих данных:") печать(egitim_data.isnull().sum()) print("\nЗначения NaN в тестовых данных:") печать(test_data.isnull().sum()) X_train = egitim_data.drop('Метка', ось=1) y_train = egitim_data['Метка'] X_test = test_data.drop('Метка', ось=1) y_test = test_data['Метка'] imputer = SimpleImputer(strategy='mean') X_train_scaled = pd.DataFrame(imputer.fit_transform(X_train), columns=X_train.columns) X_test_scaled = pd.DataFrame(imputer.transform(X_test), columns=X_test.columns) масштабатор = Стандартный масштабатор() X_train_scaled = Scaler.fit_transform(X_train_scaled) X_test_scaled = Scaler.transform(X_test_scaled) knn_model = KNeighboursClassifier(n_neighbours=5) knn_model.fit(X_train_scaled, y_train) y_pred_test = knn_model.predict(X_test_scaled) точность_теста = точность_оценки(y_test, y_pred_test) print("Точность модели на тестовых данных:", Precision_test) классификация_реп = классификация_отчет (y_test, y_pred_test, нулевое_деление = 1) print("Отчет о классификации:\n", классификация_rep)
Я отредактировал код следующим образом. Сначала у меня было 7200 фрагментов данных, я разделил их на 90% обучающих и 10% тестовых данных и создал два файла Excel. Я отредактировал эти два файла данных, используя нормализацию Z-показателя в Excel. Позже, когда я отредактировал код, он дал следующий результат. Тем не менее, это не должно быть 46%, и все еще есть ошибки или пропуски, но я не могу их найти.
Значения NaN в обучающих данных: Продолжительность потока 0 Вперед IAT мин 0 BWD IAT Мин 0 Вперед IAT Микс 0 BWD IAT Макс. 0 Прямое среднее IAT 0 Bwd IAT Среднее 0 Пакетов потока/с 0 Поток байт/с 0 Расход IAT мин 0 Расход IAT МАКС 0 Расход IAT Среднее 0 Расход IAT стандартный 0 Активный мин 0 Активное среднее 0 Активный Макс 0 Активный стандарт 0 Простой мин 0 Среднее значение простоя 0 Холостой Макс. 0 Холостой ход 0 Этикетка 0 тип d: int64 Значения NaN в тестовых данных: Продолжительность потока 0 Вперед IAT мин 0 BWD IAT Мин 0 Вперед IAT Микс 0 BWD IAT Макс. 0 Прямое среднее IAT 0 Bwd IAT Среднее 0 Пакетов потока/с 0 Поток байт/с 0 Расход IAT мин 0 Расход IAT МАКС 0 Расход IAT Среднее 0 Расход IAT стандартный 0 Активный мин 0 Активное среднее 0 Активный Макс 0 Активный стандарт 0 Простой мин 0 Среднее значение простоя 0 Холостой Макс. 0 Холостой ход 0 Этикетка 0 тип d: int64 Точность модели по данным испытаний: 0,46111111111111114. Классификационный отчет: поддержка точного отзыва по шкале f1 ПОТОКОВАЯ АУДИО 0,61 0,42 0,50 90 ПРОСМОТР 0,31 0,32 0,31 90 ЧАТ 0,28 0,34 0,31 90 ПЕРЕДАЧА ФАЙЛОВ 0,60 0,71 0,65 90 ПОЧТА 0,55 0,39 0,45 90 P2P 0,36 0,06 0,10 90 ВИДЕО-СТРИМИНГ 0,28 0,59 0,38 90 VOIP 0,96 0,86 0,91 90 точность 0,46 720 макрос в среднем 0,49 0,46 0,45 720 взвешенное среднее 0,49 0,46 0,45 720 Процесс завершен с кодом завершения 0
Что мне добавить в код или что в коде не так? ⇐ Python
Программы на Python
-
Anonymous
1704470000
Anonymous
импортировать ОС os.environ['LOKY_MAX_CPU_COUNT'] = '6' импортировать pandas**strong text** как из sklearn.preprocessing импорт StandardScaler из sklearn.neighbours импортировать KNeighboursClassifier из sklearn.metrics импорт точности_score из sklearn.impute импорт SimpleImputer из sklearn.metrics импорт классификационный_отчет egitim_data = pd.read_excel(r'C:\Users\memo3\OneDrive\Masaustü\ZSCOREEGITIMDATA.xlsx') test_data = pd.read_excel(r'C:\Users\memo3\OneDrive\Masaustü\ZSCORETESTDATA.xlsx') print("Значения NaN в обучающих данных:") печать(egitim_data.isnull().sum()) print("\nЗначения NaN в тестовых данных:") печать(test_data.isnull().sum()) X_train = egitim_data.drop('Метка', ось=1) y_train = egitim_data['Метка'] X_test = test_data.drop('Метка', ось=1) y_test = test_data['Метка'] imputer = SimpleImputer(strategy='mean') X_train_scaled = pd.DataFrame(imputer.fit_transform(X_train), columns=X_train.columns) X_test_scaled = pd.DataFrame(imputer.transform(X_test), columns=X_test.columns) масштабатор = Стандартный масштабатор() X_train_scaled = Scaler.fit_transform(X_train_scaled) X_test_scaled = Scaler.transform(X_test_scaled) knn_model = KNeighboursClassifier(n_neighbours=5) knn_model.fit(X_train_scaled, y_train) y_pred_test = knn_model.predict(X_test_scaled) точность_теста = точность_оценки(y_test, y_pred_test) print("Точность модели на тестовых данных:", Precision_test) классификация_реп = классификация_отчет (y_test, y_pred_test, нулевое_деление = 1) print("Отчет о классификации:\n", классификация_rep)
Я отредактировал код следующим образом. Сначала у меня было 7200 фрагментов данных, я разделил их на 90% обучающих и 10% тестовых данных и создал два файла Excel. Я отредактировал эти два файла данных, используя нормализацию Z-показателя в Excel. Позже, когда я отредактировал код, он дал следующий результат. Тем не менее, это не должно быть 46%, и все еще есть ошибки или пропуски, но я не могу их найти.
Значения NaN в обучающих данных: Продолжительность потока 0 Вперед IAT мин 0 BWD IAT Мин 0 Вперед IAT Микс 0 BWD IAT Макс. 0 Прямое среднее IAT 0 Bwd IAT Среднее 0 Пакетов потока/с 0 Поток байт/с 0 Расход IAT мин 0 Расход IAT МАКС 0 Расход IAT Среднее 0 Расход IAT стандартный 0 Активный мин 0 Активное среднее 0 Активный Макс 0 Активный стандарт 0 Простой мин 0 Среднее значение простоя 0 Холостой Макс. 0 Холостой ход 0 Этикетка 0 тип d: int64 Значения NaN в тестовых данных: Продолжительность потока 0 Вперед IAT мин 0 BWD IAT Мин 0 Вперед IAT Микс 0 BWD IAT Макс. 0 Прямое среднее IAT 0 Bwd IAT Среднее 0 Пакетов потока/с 0 Поток байт/с 0 Расход IAT мин 0 Расход IAT МАКС 0 Расход IAT Среднее 0 Расход IAT стандартный 0 Активный мин 0 Активное среднее 0 Активный Макс 0 Активный стандарт 0 Простой мин 0 Среднее значение простоя 0 Холостой Макс. 0 Холостой ход 0 Этикетка 0 тип d: int64 Точность модели по данным испытаний: 0,46111111111111114. Классификационный отчет: поддержка точного отзыва по шкале f1 ПОТОКОВАЯ АУДИО 0,61 0,42 0,50 90 ПРОСМОТР 0,31 0,32 0,31 90 ЧАТ 0,28 0,34 0,31 90 ПЕРЕДАЧА ФАЙЛОВ 0,60 0,71 0,65 90 ПОЧТА 0,55 0,39 0,45 90 P2P 0,36 0,06 0,10 90 ВИДЕО-СТРИМИНГ 0,28 0,59 0,38 90 VOIP 0,96 0,86 0,91 90 точность 0,46 720 макрос в среднем 0,49 0,46 0,45 720 взвешенное среднее 0,49 0,46 0,45 720 Процесс завершен с кодом завершения 0
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия