Нормализация и минимальное масштабирование в наборе данных радужной оболочки глаза

Нормализация и минимальное масштабирование в наборе данных радужной оболочки глаза ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Нормализация и минимальное масштабирование в наборе данных радужной оболочки глаза

Цитата

Сообщение Anonymous » 12 дек 2024, 21:09

Я провожу несколько экспериментов с набором данных Iris.
Я сталкиваюсь с разным поведением между MinMaxScaler и минимизацией.
Хотя я знаю, что не следует ни нормализовать, ни стандартизировать данных, я попробовал (в целях тестирования).
С помощью MinMaxScaler:

Код: Выделить всё

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=43)

scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
rf = RandomForestClassifier(random_state=43)
rf.fit(X_train, y_train)
y_pred = rf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

Я получаю точность 93,3% (воспроизводимая благодаря фиксированному начальному значению)
Затем, если я хочу попробовать тот же эксперимент с нормализацией, например это:

Код: Выделить всё

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=43)

X_train = normalize(X_train)
X_test = normalize(X_test)
rf = RandomForestClassifier(random_state=43)
rf.fit(X_train, y_train)
y_pred = rf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)

Я всегда получаю 100% точность (она начинает падать, только если я использую >50% в качестве тестового набора).
Я не могу понять почему это происходит так.
Мне бы хотелось прочитать объяснение разницы в поведении между нормализацией и MinMax.
Или даже некоторые идеи, некоторые вещи, которые мне следует проверить по порядку чтобы увидеть, что происходит.

Подробнее здесь: https://stackoverflow.com/questions/792 ... is-dataset

1734026963

Anonymous

Я провожу несколько экспериментов с набором данных Iris.
Я сталкиваюсь с разным поведением между MinMaxScaler и минимизацией.
Хотя я знаю, что не следует ни нормализовать, ни стандартизировать данных, я попробовал (в целях тестирования).
С помощью MinMaxScaler:
[code]X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=43)

scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
rf = RandomForestClassifier(random_state=43)
rf.fit(X_train, y_train)
y_pred = rf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
[/code]
Я получаю точность 93,3% (воспроизводимая благодаря фиксированному начальному значению)
Затем, если я хочу попробовать тот же эксперимент с нормализацией, например это:
[code]X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=43)

X_train = normalize(X_train)
X_test = normalize(X_test)
rf = RandomForestClassifier(random_state=43)
rf.fit(X_train, y_train)
y_pred = rf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
[/code]
Я всегда получаю 100% точность (она начинает падать, только если я использую >50% в качестве тестового набора).
Я не могу понять почему это происходит так.
Мне бы хотелось прочитать объяснение разницы в поведении между нормализацией и MinMax.
Или даже некоторые идеи, некоторые вещи, которые мне следует проверить по порядку чтобы увидеть, что происходит. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79275753/normalization-vs-minmax-scaling-on-iris-dataset[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Нормализация и минимальное масштабирование в наборе данных радужной оболочки глаза

Последнее сообщение Anonymous « 12 дек 2024, 18:53
Добавлено в форуме Python

Anonymous » 12 дек 2024, 18:53 » в форуме Python

Я провожу несколько экспериментов с набором данных Iris.
Я сталкиваюсь с разным поведением между MinMaxScaler и минимизацией.
Хотя я знаю, что не следует ни нормализовать, ни стандартизировать данных, я попробовал (в целях тестирования).
С помощью...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 18:53
Ресурс для распознавания радужной оболочки глаза с использованием Python для биометрических данных [закрыто]

Последнее сообщение Гость « 29 фев 2024, 15:34
Добавлено в форуме Python

Гость » 29 фев 2024, 15:34 » в форуме Python

Я работаю над реализацией распознавания радужной оболочки глаз для биометрической аутентификации с использованием Python. Сначала я пробовал математические подходы, но столкнулся с проблемами согласованности разных изображений. В частности,...

0 Ответы

13 Просмотры

Последнее сообщение Гость
29 фев 2024, 15:34
Как визуализировать набор данных радужной оболочки глаза на 2D-графиках для различных комбинаций объектов

Последнее сообщение Anonymous « 17 ноя 2024, 00:51
Добавлено в форуме Python

Anonymous » 17 ноя 2024, 00:51 » в форуме Python

Я хочу визуализировать набор данных радужной оболочки глаза в 2d со всеми шестью комбинациями (ширина чашелистика-длина чашелистика), (ширина лепестка-длина чашелистика), (длина чашелистика-ширина лепестка), (длина лепестка-ширина лепестка) (длина...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
17 ноя 2024, 00:51
Реплицировать pil.image.show () масштабирование и нормализация

Последнее сообщение Anonymous « 29 июл 2025, 14:10
Добавлено в форуме Python

Anonymous » 29 июл 2025, 14:10 » в форуме Python

Мне любопытно, что библиотека PIL делает масштабирование и нормализацию, чтобы показать мне четкое изображение, и почему просто делать Matplotlib на извлеченном значении Numpy выглядит очень плохо.
Вот мой код
the_image =...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
29 июл 2025, 14:10
Масштабирование функции Nearest_edges библиотеки OSMNX на огромном наборе данных Spark

Последнее сообщение Anonymous « 03 окт 2024, 23:47
Добавлено в форуме Python

Anonymous » 03 окт 2024, 23:47 » в форуме Python

Я пытаюсь масштабировать значение расстояния, возвращаемое функцией «ближайшие_грани» (из библиотеки OSMNX) в огромном наборе данных, используя столбцы широты и долготы в качестве входных данных для создания моего мутлидиграфа. Запуск занимает...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 23:47

Вернуться в «Python»