Манипулирование фреймами данных: «разбить строки» на новый фрейм данных с повторяющимися индексамиPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Манипулирование фреймами данных: «разбить строки» на новый фрейм данных с повторяющимися индексами

Сообщение Anonymous »

У меня есть два кадра данных, например df1 и df2

Код: Выделить всё

import pandas as pd
col_1= ["A", ["B","C"], ["A","C","D"], "D"]
col_id = [1,2,3,4]
col_2 = [1,2,2,3,3,4,4]
d1  = {'ID': [1,2,3,4], 'Labels': col_1}
d2  = {'ID': col_2, }
d_2_get = {'ID': col_2, "Labels": ["A", "B", "C", "A", "C", "D", np.nan] }
df1 = pd.DataFrame(data=d1)
df2 = pd.DataFrame(data=d2)
df_2_get = pd.DataFrame(data=d_2_get)
выглядит

Код: Выделить всё

    ID  col2
0   1   A
1   2   [B, C]
2   3   [A, C, D]
3   4   D
and df2 выглядит

Код: Выделить всё

    ID
0   1
1   2
2   2
3   3
4   3
5   4
6   4
Я хочу добавить столбец «Метки» в df2, взятый из df1, таким образом, чтобы:
  • для индекса i начните с первого значения в df1
  • если новая строка в df2["ID "] имеет повторяющуюся запись, получите следующее значение в df1, если оно существует. Если нет, установите NaN.
При наличии df1 и df2 вывод должен выглядеть как df_2_get ниже

Код: Выделить всё

    ID  Labels
0   1   A
1   2   B
2   2   C
3   3   A
4   3   C
5   4   D
6   4   NaN
Моя текущая неуклюжая попытка ниже,

Код: Выделить всё

from collections import Counter
def list_flattener(list_of_lists):
return [item for row in list_of_lists for item in row]

def my_dataframe_filler(df1, df2):
list_2_fill = []
repeats = dict(Counter(df2["ID"]))
for k in repeats.keys():
available_labels_list = df1[df1["ID"]==k]["Labels"].tolist()
available_labels_list+=[[np.nan]*10]
available_labels_list = list_flattener(available_labels_list)
list_2_fill+=available_labels_list[:repeats[k]]
return list_2_fill
а затем использовать как

Код: Выделить всё

df2["Labels"] = my_dataframe_filler(df1, df2)
но я хотел бы узнать, как черный пояс панды справится с этой проблемой, спасибо

Подробнее здесь: https://stackoverflow.com/questions/791 ... ed-indices
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»