Манипулирование фреймами данных: «разбить строки» на новый фрейм данных с повторяющимися индексами

Манипулирование фреймами данных: «разбить строки» на новый фрейм данных с повторяющимися индексами ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Манипулирование фреймами данных: «разбить строки» на новый фрейм данных с повторяющимися индексами

Цитата

Сообщение Anonymous » 21 окт 2024, 12:59

У меня есть два кадра данных, например df1 и df2

Код: Выделить всё

import pandas as pd
col_1= ["A", ["B","C"], ["A","C","D"], "D"]
col_id = [1,2,3,4]
col_2 = [1,2,2,3,3,4,4]
d1  = {'ID': [1,2,3,4], 'Labels': col_1}
d2  = {'ID': col_2, }
d_2_get = {'ID': col_2, "Labels": ["A", "B", "C", "A", "C", "D", np.nan] }
df1 = pd.DataFrame(data=d1)
df2 = pd.DataFrame(data=d2)
df_2_get = pd.DataFrame(data=d_2_get)

Код: Выделить всё

df1

выглядит

Код: Выделить всё

    ID  col2
0   1   A
1   2   [B, C]
2   3   [A, C, D]
3   4   D

and df2 выглядит

Код: Выделить всё

Я хочу добавить столбец «Метки» в df2, взятый из df1, таким образом, чтобы:

для индекса i начните с первого значения в df1
если новая строка в df2["ID "] имеет повторяющуюся запись, получите следующее значение в df1, если оно существует. Если нет, установите NaN.

При наличии df1 и df2 вывод должен выглядеть как df_2_get ниже

Код: Выделить всё

    ID  Labels
0   1   A
1   2   B
2   2   C
3   3   A
4   3   C
5   4   D
6   4   NaN

Моя текущая неуклюжая попытка ниже,

Код: Выделить всё

from collections import Counter
def list_flattener(list_of_lists):
return [item for row in list_of_lists for item in row]

def my_dataframe_filler(df1, df2):
list_2_fill = []
repeats = dict(Counter(df2["ID"]))
for k in repeats.keys():
available_labels_list = df1[df1["ID"]==k]["Labels"].tolist()
available_labels_list+=[[np.nan]*10]
available_labels_list = list_flattener(available_labels_list)
list_2_fill+=available_labels_list[:repeats[k]]
return list_2_fill

а затем использовать как

Код: Выделить всё

df2["Labels"] = my_dataframe_filler(df1, df2)

но я хотел бы узнать, как черный пояс панды справится с этой проблемой, спасибо

Подробнее здесь: https://stackoverflow.com/questions/791 ... ed-indices

1729504768

Anonymous

У меня есть два кадра данных, например df1 и df2
[code]import pandas as pd
col_1= ["A", ["B","C"], ["A","C","D"], "D"]
col_id = [1,2,3,4]
col_2 = [1,2,2,3,3,4,4]
d1  = {'ID': [1,2,3,4], 'Labels': col_1}
d2  = {'ID': col_2, }
d_2_get = {'ID': col_2, "Labels": ["A", "B", "C", "A", "C", "D", np.nan] }
df1 = pd.DataFrame(data=d1)
df2 = pd.DataFrame(data=d2)
df_2_get = pd.DataFrame(data=d_2_get)
[/code]
[code]df1[/code] выглядит
[code]    ID  col2
0   1   A
1   2   [B, C]
2   3   [A, C, D]
3   4   D
[/code]
and df2 выглядит
[code]    ID
0   1
1   2
2   2
3   3
4   3
5   4
6   4
[/code]
Я хочу добавить столбец «Метки» в df2, взятый из df1, таким образом, чтобы:
[list]
[*]для индекса i начните с первого значения в df1
[*]если новая строка в df2["ID "] имеет повторяющуюся запись, получите следующее значение в df1, если оно существует. Если нет, установите NaN.
[/list]
При наличии df1 и df2 вывод должен выглядеть как df_2_get ниже
[code]    ID  Labels
0   1   A
1   2   B
2   2   C
3   3   A
4   3   C
5   4   D
6   4   NaN
[/code]
Моя текущая неуклюжая попытка ниже,
[code]from collections import Counter
def list_flattener(list_of_lists):
return [item for row in list_of_lists for item in row]

def my_dataframe_filler(df1, df2):
list_2_fill = []
repeats = dict(Counter(df2["ID"]))
for k in repeats.keys():
available_labels_list = df1[df1["ID"]==k]["Labels"].tolist()
available_labels_list+=[[np.nan]*10]
available_labels_list = list_flattener(available_labels_list)
list_2_fill+=available_labels_list[:repeats[k]]
return list_2_fill
[/code]
а затем использовать как
[code]df2["Labels"] = my_dataframe_filler(df1, df2)
[/code]
но я хотел бы узнать, как черный пояс панды справится с этой проблемой, спасибо 

Подробнее здесь: [url]https://stackoverflow.com/questions/79109524/dataframe-manipulation-explode-rows-on-new-dataframe-with-repeated-indices[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Манипулирование фреймами данных: «разбить строки» на новый фрейм данных с повторяющимися индексами

Последнее сообщение Anonymous « 21 окт 2024, 13:46
Добавлено в форуме Python

Anonymous » 21 окт 2024, 13:46 » в форуме Python

У меня есть два кадра данных, например df1 и df2
import pandas as pd
col_1= [ A , , , D ]
col_id =
col_2 =
d1 = {'ID': , 'Labels': col_1}
d2 = {'ID': col_2, }
d_2_get = {'ID': col_2, Labels : }
df1 = pd.DataFrame(data=d1)
df2 =...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
21 окт 2024, 13:46
Как загрузить электронную таблицу XML с индексами прыгающих столбцов в фрейм данных Databricks/Pandas

Последнее сообщение Anonymous « 01 июн 2024, 00:05
Добавлено в форуме Python

Anonymous » 01 июн 2024, 00:05 » в форуме Python

Я относительно новичок в Databricks. У меня есть данные электронной таблицы XML, как показано ниже:

ColHeader1

ColHeader2

ColHeader3

ColHeader4

ColHeader5

Cell_1_1

2024-04-03T07:22:28.433

cell_1_5

cell_2_1...

0 Ответы

110 Просмотры

Последнее сообщение Anonymous
01 июн 2024, 00:05
Как эффективно преобразовать фрейм данных в желаемый новый фрейм данных?

Последнее сообщение Anonymous « 17 июл 2024, 11:53
Добавлено в форуме Python

Anonymous » 17 июл 2024, 11:53 » в форуме Python

x — это фрейм данных:
x
year mar 31, 2024 mar 31, 2023
0 net income 306.000 524.0000
1 net income growth -0.416 -0.0455
2 retained rate NaN NaN
3 pe 419.930 0.0000

Это индекс строки и имя столбца:
x.index
RangeIndex(start=0, stop=4, step=1)...

0 Ответы

46 Просмотры

Последнее сообщение Anonymous
17 июл 2024, 11:53
Как замаскировать фрейм данных Polars, используя другой фрейм данных?

Последнее сообщение Anonymous « 28 сен 2024, 00:02
Добавлено в форуме Python

Anonymous » 28 сен 2024, 00:02 » в форуме Python

У меня есть такой фрейм данных Polars:
df = pl.from_repr(
┌─────────────────────┬─────────┬─────────┐
│ time ┆ 1 ┆ 2 │
│ --- ┆ --- ┆ --- │
│ datetime ┆ f64 ┆ f64 │
╞═════════════════════╪═════════╪═════════╡
│ 2021-10-02 00:05:00 ┆ 2.9048 ┆ 2.8849...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
28 сен 2024, 00:02
Как преобразовать сплющенный горизонтальный фрейм данных в кортеж, например вертикальный фрейм данных? [дубликат]

Последнее сообщение Anonymous « 07 ноя 2024, 20:34
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 20:34 » в форуме Python

У меня есть такой фрейм данных pandas:
Year Alaska Alabama Arkansas
1800 1.83 1.314 0.124
1901 1.907 1.341 0.131
1902 1.935 1.36 0.138
1903 1.957 1.384 0.144
1909 1.978 1.419 0.151

Я хочу преобразовать это так:
Name, Year, Value...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 20:34

Вернуться в «Python»