По сути, у меня есть df с моделью автомобиля+годом в виде строки в 1 столбце. Кадр данных представляет собой коллекцию подержанных автомобилей, выставленных на продажу, поэтому есть повторяющиеся строки модель + год, но не дублированные целые строки. В этом df отсутствуют значения базовой информации об автомобиле, такой как количество мест и т. д. Пример ниже
model_year: A4_2022, mustang_1966, A4_2022, defer_1988
двигатель: v4, v8, null , null
места: null, 5, null, 8
В отдельном df у меня есть полные значения для коллекции модель+год (не все).
год модели: a4_2022, defer_1988
двигатель: v4, v8
количество мест: 5, 8
**Как пройти первый фрейм данных, проверьте наличие пропущенных значений, где они отсутствуют -> извлеките значение из второго фрейма данных, где соответствует model_year?
**
Я попробовал следующее, но это не помогло похоже, заполняют недостающие значения. Код неправильный? Также возможно, что model_year в первом кадре данных просто не существует во втором кадре данных.
for index, row in df.iterrows():
if pd.isnull(row['Seats']):
model = row['model_year']
seats = df_model[df_model['model_year'] == model]['Seats'].values
if len(seats) > 0:
df.loc[index, 'Seats'] = seats[0]
Подробнее здесь: https://stackoverflow.com/questions/785 ... nother-dat
Как заполнить недостающие значения в фрейме данных значениями, найденными в другом фрейме данных, используя значение пои ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение