Pandas группируется по fillna с первым допустимым значением (оконные функции)

Pandas группируется по fillna с первым допустимым значением (оконные функции) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Pandas группируется по fillna с первым допустимым значением (оконные функции)

Цитата

Сообщение Anonymous » 27 июн 2024, 21:57

У меня есть набор данных, в котором мне нужно условно заполнить первое значение из соответствующей группы, но я не могу это понять.
import numpy as np
import pandas as pd
df_dict = {
'id':[1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2],
'data':['A', np.nan, np.nan, np.nan, 'B', np.nan, np.nan, np.nan, 'C', np.nan, np.nan]
}
df = pd.DataFrame(df_dict)

Мне нужно создать фрейм данных, который выглядит следующим образом:
final_dict = {
'id':[1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2],
'data':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C']
}
final = pd.DataFrame(final_dict)

Мне хочется сгруппировать по идентификатору, а затем выполнить .fillna(что-то), но я не могу понять, что делать.Я пробовал
df.groupby('id')['data'].fillna(df['data'].first_valid_index())

но это ставит 0 вместо копирования того, что я хочу.
У меня также есть другое частичное решение:for col_name, data in df.items():
df[col_name] = df.groupby('id').apply(
lambda x: x[col_name].fillna(x.loc[x[col_name].last_valid_index(), col_name])
).reset_index(drop=True)

Подробнее здесь: https://stackoverflow.com/questions/546 ... -functions

1719514656

Anonymous

У меня есть набор данных, в котором мне нужно условно заполнить первое значение из соответствующей группы, но я не могу это понять.
import numpy as np
import pandas as pd
df_dict = {
'id':[1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2],
'data':['A', np.nan, np.nan, np.nan, 'B', np.nan, np.nan, np.nan, 'C', np.nan, np.nan]
}
df = pd.DataFrame(df_dict)

Мне нужно создать фрейм данных, который выглядит следующим образом:
final_dict = {
'id':[1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2],
'data':['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C']
}
final = pd.DataFrame(final_dict)

Мне хочется сгруппировать по идентификатору, а затем выполнить .fillna(что-то), но я не могу понять, что делать.Я пробовал
df.groupby('id')['data'].fillna(df['data'].first_valid_index())

но это ставит 0 вместо копирования того, что я хочу.
У меня также есть другое частичное решение:for col_name, data in df.items():
df[col_name] = df.groupby('id').apply(
lambda x: x[col_name].fillna(x.loc[x[col_name].last_valid_index(), col_name])
).reset_index(drop=True)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/54674853/pandas-groupby-fillna-with-first-valid-value-window-functions[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Сортируйте массив numpy по строкам в соответствии с первым значением каждой строки, затем вторым значением [дубликат]

Последнее сообщение Anonymous « 02 окт 2024, 18:53
Добавлено в форуме Python

Anonymous » 02 окт 2024, 18:53 » в форуме Python

Я пытаюсь отсортировать массив по строкам по первому значению каждой строки, затем по второму значению, если первые одинаковы, и так далее...
Например, этот массив
l_2d = np.array([ , , , ])
l_2d
array([ ,
,
,
])

должно быть отсортировано...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
02 окт 2024, 18:53
Pandas группируется по неделям и получает данные за прошлую неделю как новый df

Последнее сообщение Anonymous « 14 ноя 2024, 03:23
Добавлено в форуме Python

Anonymous » 14 ноя 2024, 03:23 » в форуме Python

У меня есть df, который имеет следующее: df.dtypes:

key object
date datetime64
username object
answer object
grade object
dtype: object

Затем я группирую по неделям:

test_lastweek = df.groupby( ) .count()

Я вижу, что это 45 записей,...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
14 ноя 2024, 03:23
Pandas группируется по неделям и получает данные за прошлую неделю как новый df

Последнее сообщение Anonymous « 15 ноя 2024, 11:51
Добавлено в форуме Python

Anonymous » 15 ноя 2024, 11:51 » в форуме Python

У меня есть df, который имеет следующее: df.dtypes:

key object
date datetime64
username object
answer object
grade object
dtype: object

Затем я группирую по неделям:

test_lastweek = df.groupby( ) .count()

Я вижу, что это 45 записей,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
15 ноя 2024, 11:51
Pandas fillna на основе условия из другого фрейма данных

Последнее сообщение Гость « 17 мар 2024, 12:39
Добавлено в форуме Python

Гость » 17 мар 2024, 12:39 » в форуме Python

Таблица 1

Идентификатор
Состояние
Проверка 1
Проверка 2

1
аа
нан
нан

2
bb
nan
nan

3
аа
нан
нан

4
bb
nan
нан

5
aa
нан
нан

6
bb
nan
nan

Таблица 2

Имя
Состояние
Доступ1
Доступ2

Джон
аа
ДА
Н

Мэри
bb
Да
Н

Боб
ааДа
Да...

0 Ответы

34 Просмотры

Последнее сообщение Гость
17 мар 2024, 12:39
Pandas FutureWarning: преобразование массивов dtype объектов в .fillna, .ffill, .bfill устарело и изменится в будущей ве

Последнее сообщение Anonymous « 26 май 2024, 01:33
Добавлено в форуме Python

Anonymous » 26 май 2024, 01:33 » в форуме Python

Чтобы правильно распечатать кадры данных с помощью таблицы, чтобы NaN и NaT печатались как пустые ячейки, я успешно использовал это:
print(tabulate(df.astype(object).fillna( )))

Теперь это вызывает следующее предупреждение:

FutureWarning:...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
26 май 2024, 01:33

Вернуться в «Python»