Это задание 1:Задача 1
Моя реализация:
Код: Выделить всё
import pandas as pd
clean_data = pd.read_csv('ebike_data.csv')
clean_data['bike_type'] = clean_data['bike_type'].fillna('standard')
clean_data['frame_material'] = clean_data['frame_material'].fillna('unknown')
clean_data['frame_material'] = clean_data['frame_material'].str.lower()
clean_data['production_cost'] = clean_data['production_cost'].fillna(clean_data['production_cost'].median()).astype(float)
clean_data['assembly_time'] = clean_data['assembly_time'].fillna(clean_data['assembly_time'].mean()).astype(int)
clean_data['top_speed'] = clean_data['top_speed'].fillna(clean_data['top_speed'].mean()).astype(int)
clean_data['battery_type'] = clean_data['battery_type'].fillna('other')
clean_data['battery_type'] = clean_data['battery_type'].replace({'-':'other', 'liotherion': 'li-ion'})
clean_data['customer_score'] = clean_data['customer_score'].fillna(clean_data['customer_score'].mean()).clip(lower=1, upper=10).astype(int)
clean_data['motor_power'] = clean_data['motor_power'].str.replace('W','').astype(float)
clean_data['motor_power'] = clean_data['motor_power'].fillna(clean_data['motor_power'].median()).astype(int)
print(clean_data.info())
print(clean_data.isna().sum())
Код: Выделить всё
angeIndex: 2000 entries, 0 to 1999
Data columns (total 8 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 bike_type 2000 non-null object
1 frame_material 2000 non-null object
2 production_cost 2000 non-null float64
3 assembly_time 2000 non-null int64
4 top_speed 2000 non-null int64
5 battery_type 2000 non-null object
6 motor_power 2000 non-null int64
7 customer_score 2000 non-null int64
dtypes: float64(1), int64(4), object(3)
memory usage: 125.1+ KB
None
bike_type 0
frame_material 0
production_cost 0
assembly_time 0
top_speed 0
battery_type 0
motor_power 0
customer_score 0
dtype: int64
Все необходимые данные созданы и имеют необходимые столбцы — ПРОВЕРЬТЕ
Задача 1. Определить и заменить пропущенные значения – НЕ ПРОВЕРЕНО
Задача 1. Преобразовать значения между типами данных – ПРОВЕРИТЬ
Задача 1. Очистить категориальные и текстовые данные путем манипулирования строками – ПРОВЕРИТЬ
Подробнее здесь: https://stackoverflow.com/questions/791 ... nnovations