Я работаю с набором данных, содержащим сведения о подержанных автомобилях, и обнаружил несколько пропущенных значений в столбце Fuel_Type. Возможные значения: «Бензин», «E85 Flex Fuel», «Гибрид», «Дизель» и другие. В настоящее время в моих данных имеется более 4000 электромобилей, менее 50 автомобилей с бензиновым двигателем и несколько гибридов, в которых отсутствуют записи Fuel_Type. Кроме того, некоторые записи содержат нестандартные значения, такие как «–» и «не поддерживается». Точное заполнение этих пропущенных значений имеет решающее значение для моего анализа, поскольку они существенно влияют на результаты.
import pandas as pd
import numpy as np
from sklearn.impute import SimpleImputer
# Sample DataFrame
data = {
'Car': ['Toyota', 'Honda', 'Tesla', None, 'Ford'],
'Fuel_Type': ['Gasoline', 'E85 Flex Fuel', np.nan, 'Hybrid', None],
'Transmission': ['Automatic', None, 'Automatic', 'Manual', 'Manual']
}
df = pd.DataFrame(data)
# Initial imputation attempt
imputer = SimpleImputer(strategy='most_frequent')
df['Fuel_Type'] = imputer.fit_transform(df[['Fuel_Type']])
print(df)
Подробнее здесь: https://stackoverflow.com/questions/790 ... -a-dataset
Как добиться точного вменения пропущенных значений в наборе данных? ⇐ Python
Программы на Python
-
Anonymous
1727421340
Anonymous
Я работаю с набором данных, содержащим сведения о подержанных автомобилях, и обнаружил несколько пропущенных значений в столбце Fuel_Type. Возможные значения: «Бензин», «E85 Flex Fuel», «Гибрид», «Дизель» и другие. В настоящее время в моих данных имеется более 4000 электромобилей, менее 50 автомобилей с бензиновым двигателем и несколько гибридов, в которых отсутствуют записи Fuel_Type. Кроме того, некоторые записи содержат нестандартные значения, такие как «–» и «не поддерживается». Точное заполнение этих пропущенных значений имеет решающее значение для моего анализа, поскольку они существенно влияют на результаты.
import pandas as pd
import numpy as np
from sklearn.impute import SimpleImputer
# Sample DataFrame
data = {
'Car': ['Toyota', 'Honda', 'Tesla', None, 'Ford'],
'Fuel_Type': ['Gasoline', 'E85 Flex Fuel', np.nan, 'Hybrid', None],
'Transmission': ['Automatic', None, 'Automatic', 'Manual', 'Manual']
}
df = pd.DataFrame(data)
# Initial imputation attempt
imputer = SimpleImputer(strategy='most_frequent')
df['Fuel_Type'] = imputer.fit_transform(df[['Fuel_Type']])
print(df)
Подробнее здесь: [url]https://stackoverflow.com/questions/79030256/how-can-i-achieve-accurate-imputation-of-missing-values-in-a-dataset[/url]
Ответить
1 сообщение
• Страница 1 из 1
Перейти
- Кемерово-IT
- ↳ Javascript
- ↳ C#
- ↳ JAVA
- ↳ Elasticsearch aggregation
- ↳ Python
- ↳ Php
- ↳ Android
- ↳ Html
- ↳ Jquery
- ↳ C++
- ↳ IOS
- ↳ CSS
- ↳ Excel
- ↳ Linux
- ↳ Apache
- ↳ MySql
- Детский мир
- Для души
- ↳ Музыкальные инструменты даром
- ↳ Печатная продукция даром
- Внешняя красота и здоровье
- ↳ Одежда и обувь для взрослых даром
- ↳ Товары для здоровья
- ↳ Физкультура и спорт
- Техника - даром!
- ↳ Автомобилистам
- ↳ Компьютерная техника
- ↳ Плиты: газовые и электрические
- ↳ Холодильники
- ↳ Стиральные машины
- ↳ Телевизоры
- ↳ Телефоны, смартфоны, плашеты
- ↳ Швейные машинки
- ↳ Прочая электроника и техника
- ↳ Фототехника
- Ремонт и интерьер
- ↳ Стройматериалы, инструмент
- ↳ Мебель и предметы интерьера даром
- ↳ Cантехника
- Другие темы
- ↳ Разное даром
- ↳ Давай меняться!
- ↳ Отдам\возьму за копеечку
- ↳ Работа и подработка в Кемерове
- ↳ Давай с тобой поговорим...
Мобильная версия