Значения NAN после применения итеративного импультера и обратного преобразования данных

Значения NAN после применения итеративного импультера и обратного преобразования данных ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Значения NAN после применения итеративного импультера и обратного преобразования данных

Цитата

Сообщение Anonymous » 31 мар 2025, 20:17

Я использую iterativeImputer из Sklearn.Impute, чтобы заполнить недостающие значения в моем наборе данных. Один из моих столбцов, Education_level, является категориальной функцией, поэтому я сначала применил метку для преобразования его в числовую форму, прежде чем вменять. Однако после обратного преобразования кодированных значений обратно в их исходные категории я получаю значения NAN в некоторых строках.import numpy as np
import pandas as pd
from sklearn.experimental import enable_iterative_imputer
from sklearn.impute import IterativeImputer
from sklearn.preprocessing import StandardScaler, LabelEncoder

# Copy the original dataset
df_iter = df.copy()

# Encode categorical column
encoder = LabelEncoder()
df_iter['Education_Level'] = encoder.fit_transform(df_iter['Education_Level'])

# Apply StandardScaler
scaler = StandardScaler()
data_scaled = scaler.fit_transform(df_iter)

# Apply IterativeImputer
imputer = IterativeImputer(max_iter=10, random_state=42)
imputed_data = imputer.fit_transform(data_scaled)

# Convert back to original scale
df_iter = pd.DataFrame(scaler.inverse_transform(imputed_data), columns=df_iter.columns)

# Convert Education_Level back to integer values
df_iter['Education_Level'] = np.round(df_iter['Education_Level']).astype(int)

# Inverse transform the encoded labels
df_iter['Education_Level'] = encoder.inverse_transform(df_iter['Education_Level'])
< /code>
Проблема, с которой сталкиваются:
Некоторые строки в образовании_LEVEL по -прежнему содержат значения NAN после upverse_transform. 
Я подозреваю, что итеративный Иимпутер генерирует значения, которые не совпадают с исходными категориями, приводящие к ошибке, когда они не соответствуют значениям. Точно соответствует исходным кодируемым категориям? Описание изображения здесь
Введите описание изображения здесь 
Что я попробовал
использовал использованный метка Значения. 
обратное преобразование данных обратно с использованием strandardscaler.inverse_transform. 
округление значений образования_лвеля до ближайшего целого числа, прежде чем я ожидал, что я ожидал, что я ожидал, что я ожидаю, что я ожидаю, что я ожидал, что я ожидаю, что я ожидал, что я ожидал, что я ожидал, что я ожидал, что я ожидал, что я ожидаю, что я ожидаю, что я ожидаю, что я ожидаю, что я ожидаю, что я ожидал. переменные. 
После обратной преобразования метки, я ожидал, что все строки имеют достоверные метки категорий вместо NAN. 
Что на самом деле произошло
Некоторые строки в образовании. (например, 1,75, 2.3), который не отображался правильно с исходными категориями метки. 
Дополнительные попытки исправить его
Пробое значения округления перед обратным преобразованием, но все же получили NAN, потому что некоторые значения были немного за пределами достоверного диапазона марки.>

Подробнее здесь: https://stackoverflow.com/questions/795 ... belencoded

1743441442

Anonymous

 Я использую iterativeImputer из Sklearn.Impute, чтобы заполнить недостающие значения в моем наборе данных. Один из моих столбцов, Education_level, является категориальной функцией, поэтому я сначала применил метку для преобразования его в числовую форму, прежде чем вменять. Однако после обратного преобразования кодированных значений обратно в их исходные категории я получаю значения NAN в некоторых строках.import numpy as np
import pandas as pd
from sklearn.experimental import enable_iterative_imputer
from sklearn.impute import IterativeImputer
from sklearn.preprocessing import StandardScaler, LabelEncoder

# Copy the original dataset
df_iter = df.copy()

# Encode categorical column
encoder = LabelEncoder()
df_iter['Education_Level'] = encoder.fit_transform(df_iter['Education_Level'])

# Apply StandardScaler
scaler = StandardScaler()
data_scaled = scaler.fit_transform(df_iter)

# Apply IterativeImputer
imputer = IterativeImputer(max_iter=10, random_state=42)
imputed_data = imputer.fit_transform(data_scaled)

# Convert back to original scale
df_iter = pd.DataFrame(scaler.inverse_transform(imputed_data), columns=df_iter.columns)

# Convert Education_Level back to integer values
df_iter['Education_Level'] = np.round(df_iter['Education_Level']).astype(int)

# Inverse transform the encoded labels
df_iter['Education_Level'] = encoder.inverse_transform(df_iter['Education_Level'])
< /code>
Проблема, с которой сталкиваются:
Некоторые строки в образовании_LEVEL по -прежнему содержат значения NAN после upverse_transform. < /p>
Я подозреваю, что итеративный Иимпутер генерирует значения, которые не совпадают с исходными категориями, приводящие к ошибке, когда они не соответствуют значениям. Точно соответствует исходным кодируемым категориям? Описание изображения здесь
Введите описание изображения здесь < /p>
Что я попробовал
использовал использованный метка Значения. < /p>
обратное преобразование данных обратно с использованием strandardscaler.inverse_transform. < /p>
округление значений образования_лвеля до ближайшего целого числа, прежде чем я ожидал, что я ожидал, что я ожидал, что я ожидаю, что я ожидаю, что я ожидал, что я ожидаю, что я ожидал, что я ожидал, что я ожидал, что я ожидал, что я ожидал, что я ожидаю, что я ожидаю, что я ожидаю, что я ожидаю, что я ожидаю, что я ожидал. переменные. < /p>
После обратной преобразования метки, я ожидал, что все строки имеют достоверные метки категорий вместо NAN. < /p>
Что на самом деле произошло
Некоторые строки в образовании. (например, 1,75, 2.3), который не отображался правильно с исходными категориями метки. < /p>
Дополнительные попытки исправить его
Пробое значения округления перед обратным преобразованием, но все же получили NAN, потому что некоторые значения были немного за пределами достоверного диапазона марки.> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79546862/nan-values-after-applying-iterativeimputer-and-inverse-transforming-labelencoded[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Вычисление повторного интеграла путем итеративного применения правила одномерных трапеций.

Последнее сообщение Anonymous « 18 дек 2024, 19:52
Добавлено в форуме Python

Anonymous » 18 дек 2024, 19:52 » в форуме Python

У меня есть функция Python под названием catch_1D, которая вычисляет (приблизительный) интеграл одномерной функции f на интервале с использованием правила составной трапеции. Теперь я хочу вычислить повторный интеграл в форме \int_{a}^{b}...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
18 дек 2024, 19:52
Является ли number ("nan") = NAN, потому что JS распознает «NAN» как значение типа номера или потому, что это строка, а

Последнее сообщение Anonymous « 30 апр 2025, 09:46
Добавлено в форуме Javascript

Anonymous » 30 апр 2025, 09:46 » в форуме Javascript

Например, число («бесконечность») = бесконечность, потому что он распознает его как число типов, поэтому мне было интересно, если номер («NAN») = NAN по той же причине, по которой число («картофель») = NAN или потому, что он распознает его как...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
30 апр 2025, 09:46
Многопоточные методы вычисления итеративного решателя (итерации Якоби) на ЦП

Последнее сообщение Anonymous « 31 мар 2024, 03:55
Добавлено в форуме JAVA

Anonymous » 31 мар 2024, 03:55 » в форуме JAVA

Я пытаюсь реализовать многопоточную реализацию решателя jacobi. Я попробовал два разных метода с одинаковой скоростью.
Мой вопрос

Есть ли лучший способ сделать это ?

ДА: Что бы это было?
НЕТ: Какой из моих методов — C?

Контекст
Я использую...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
31 мар 2024, 03:55
Оптимизация итеративного расчета a[i] = a[i-1]*b[i] + c[i] с помощью NumPy

Последнее сообщение Anonymous « 16 май 2024, 11:27
Добавлено в форуме Python

Anonymous » 16 май 2024, 11:27 » в форуме Python

Я хотел бы оптимизировать вычисления с использованием рекурсивной формулы:
#a, b, c are arrays of shape (N, )

a = c

for i in range(1, N):
a = a *b + c

Есть ли способ вернуть результат с помощью комбинации оптимизированных методов NumPy?...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
16 май 2024, 11:27
Сбой системы при использовании OMPython для запуска итеративного моделирования с помощью OpenModelica (OMC)

Последнее сообщение Anonymous « 01 ноя 2024, 09:11
Добавлено в форуме Python

Anonymous » 01 ноя 2024, 09:11 » в форуме Python

Я использую OMPython для запуска моделирования с OpenModelica через OMCSessionZMQ, но столкнулся с сбоем системы (сбой на синем экране с кодом остановки REFERENCE BY POINTER в Windows и зависание в Ubuntu).
Я написал Python программа для создания...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
01 ноя 2024, 09:11

Вернуться в «Python»