Python берет данные из двух разных фреймов данных, создает новый фрейм данных и структурирует данные, собранные из двух

Python берет данные из двух разных фреймов данных, создает новый фрейм данных и структурирует данные, собранные из двух ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Python берет данные из двух разных фреймов данных, создает новый фрейм данных и структурирует данные, собранные из двух

Цитата

Сообщение Anonymous » 01 май 2024, 22:34

Я новичок в Python и столкнулся с проблемой решения проблем.

Код: Выделить всё

# First Dataframe
df1 = pd.DataFrame({
'name': ['Adam','Ashley','Adam','Don',],
'items': ['Apple','Banana','Cherry','Date'],
'Quantity': [10,15,20,25]
})

# second dataframe
df2 = pd.DataFrame({
'name': ['Adam','Ashley','Adam','Sunny'],
'items': ['Apple','Banana','Scale','Pickle'],
'Quantity': [11,10,15,20]
})

Два приведенных выше фрейма данных имеют некоторые похожие значения и некоторые несходные значения.
Я хочу объединить эти два и подготовить фрейм данных — это имеет :

просматривает оба фрейма данных и собирает похожие значения для каждого имени в одном кадр данных. Например: у Адама две записи.
затем прокрутите список и посмотрите, в чем проблема, например. несоответствующий товар или несоответствующее количество и заполните им новый столбец «причина». Что касается остатков, мне просто нужно добавить «недоступно» в df1/df2
Я хочу сохранять пустую строку после каждого цикла (1) итерация, т. е. после прохождения каждого имени.

Код: Выделить всё

# Result
df3 = pd.DataFrame({
'name': ['Adam', 'Adam', None, 'Ashley', None, 'Don',None, None],
'items': ['Apple', 'Cherry', None, 'Banana', None, 'Date', None, None],
'Quantity': [10, 15, None, 20, None, 25, None, None],
'name_2': ['Adam', 'Adam', None, 'Ashley', None, None, None, 'Sunny'],
'items_2': ['Apple', 'Scale', None, 'Banana', None, None, None, 'Pickle'],
'Quantity_2': [11, 10, None, 15, None, None, None, 20],
'Reason' : ['Quantity mismatch', 'Item mismatch', None, 'Quantity mismatch', None, 'Does not exist in df2', None, 'does not exist in df1']
})

Я буду очень признателен за любую помощь в этом. Заранее спасибо!
Я собрал эти строки из разных источников и, конечно же, это не работает и показывает разные ошибки.

Код: Выделить всё

new_df = pd.DataFrame()
for item in df1["name"]:
idx = df2[df2["name"].eq(item)].min()
idx2 = df1[df1["name"].eq(item)].min()

new_df = new_df.append(df1[idx2])
new_df = new_df.append(df2[idx])

for i in idx():
if df2["name"][i] in df1["name"]:
if df2["item"][i] in df1[item]:
new_df["Reason"][i] = "Quantity Mismatch"
else:
new_df["Reason"][i] = "Item Mismatch"
else:
new_df["Reason"][i] = "Does not exist in df1"

Подробнее здесь: https://stackoverflow.com/questions/784 ... -and-struc

1714592096

Anonymous

Я новичок в Python и столкнулся с проблемой решения проблем.
[code]# First Dataframe
df1 = pd.DataFrame({
'name': ['Adam','Ashley','Adam','Don',],
'items': ['Apple','Banana','Cherry','Date'],
'Quantity': [10,15,20,25]
})

# second dataframe
df2 = pd.DataFrame({
'name': ['Adam','Ashley','Adam','Sunny'],
'items': ['Apple','Banana','Scale','Pickle'],
'Quantity': [11,10,15,20]
})
[/code]
Два приведенных выше фрейма данных имеют некоторые похожие значения и некоторые несходные значения.
Я хочу объединить эти два и подготовить фрейм данных — это имеет :
[list]
[*]просматривает оба фрейма данных и собирает [b]похожие значения[/b] для [b]каждого имени[/b] в одном кадр данных. Например: у Адама две записи.

[*]затем прокрутите список и посмотрите, в чем проблема, например. несоответствующий товар или несоответствующее количество и заполните им новый столбец «причина». Что касается остатков, мне просто нужно добавить «недоступно» в df1/df2

[*]Я хочу сохранять пустую строку после каждого цикла (1) итерация, т. е. после прохождения каждого имени.

[/list]
[code]
# Result
df3 = pd.DataFrame({
'name': ['Adam', 'Adam', None, 'Ashley', None, 'Don',None, None],
'items': ['Apple', 'Cherry', None, 'Banana', None, 'Date', None, None],
'Quantity': [10, 15, None, 20, None, 25, None, None],
'name_2': ['Adam', 'Adam', None, 'Ashley', None, None, None, 'Sunny'],
'items_2': ['Apple', 'Scale', None, 'Banana', None, None, None, 'Pickle'],
'Quantity_2': [11, 10, None, 15, None, None, None, 20],
'Reason' : ['Quantity mismatch', 'Item mismatch', None, 'Quantity mismatch', None, 'Does not exist in df2', None, 'does not exist in df1']
})

[/code]
Я буду очень признателен за любую помощь в этом. Заранее спасибо!
Я собрал эти строки из разных источников и, конечно же, это не работает и показывает разные ошибки.
[code]new_df = pd.DataFrame()
for item in df1["name"]:
idx = df2[df2["name"].eq(item)].min()
idx2 = df1[df1["name"].eq(item)].min()

new_df = new_df.append(df1[idx2])
new_df = new_df.append(df2[idx])

for i in idx():
if df2["name"][i] in df1["name"]:
if df2["item"][i] in df1[item]:
new_df["Reason"][i] = "Quantity Mismatch"
else:
new_df["Reason"][i] = "Item Mismatch"
else:
new_df["Reason"][i] = "Does not exist in df1"
[/code]
[img]https://i.sstatic.net/2LYi0pM6.png[/img]
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78415164/python-take-data-from-two-different-dataframes-create-a-new-dataframe-and-struc[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как выполнить модульное тестирование сценариев AWS Glue с использованием pytest, динамических фреймов и фреймов данных?

Последнее сообщение Anonymous « 04 дек 2024, 20:54
Добавлено в форуме Python

Anonymous » 04 дек 2024, 20:54 » в форуме Python

Я хочу провести модульное тестирование своих скриптов AWS Glue. Я использую Python и Pyspark. Я хочу объединить функции модульного тестирования, использующие динамические фреймы и фреймы данных. Мне не нужно взаимодействовать с AWS или передавать...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
04 дек 2024, 20:54
Покрытие кода Java с Jacoco. Merge Exec Files, собранные в разных версиях приложений

Последнее сообщение Anonymous « 18 авг 2025, 12:41
Добавлено в форуме JAVA

Anonymous » 18 авг 2025, 12:41 » в форуме JAVA

Я пытаюсь установить процесс сбора охвата тестов QA и агрегирования этой информации в один отчет. У нас очень часто есть большие изменения в команде и кода, поэтому моя основная проблема была связана с невозможностью сбора покрытия из версии единого...

0 Ответы

0 Просмотры

Последнее сообщение Anonymous
18 авг 2025, 12:41
Эта функция Python берет лист Excel, объединяет все таблицы и создает «главную таблицу». Почему он печатает повторяющиес

Последнее сообщение Anonymous « 30 сен 2024, 18:13
Добавлено в форуме Python

Anonymous » 30 сен 2024, 18:13 » в форуме Python

По сути, каждый раз, когда я запускаю этот код, таблица создается. Когда я смотрю на таблицу, каждая строка печатается дважды. Я нажимаю «Удалить дубликаты» в приложении Excel и всегда получаю сообщение о том, что найдено и удалено 33 повторяющихся...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
30 сен 2024, 18:13
Объединение нескольких фреймов данных в фрейм данных многоиндексных столбцов

Последнее сообщение Гость « 27 фев 2024, 18:42
Добавлено в форуме Python

Гость » 27 фев 2024, 18:42 » в форуме Python

Предположим, у меня есть 3 фрейма данных

df_1 представляет доход

Год TSLA MSFT AVY 2019 851 200 112,8 2018 725 150 92,6 df_2 представляет некоторые другие доходы

Год TSLA MSFT AVY 2019 10 13 17 2018 11 14 18 и df_3 представляют расходы

Год...

0 Ответы

83 Просмотры

Последнее сообщение Гость
27 фев 2024, 18:42
Разделить фрейм данных на n фреймов данных по значению столбца в полярах

Последнее сообщение Anonymous « 18 сен 2024, 14:02
Добавлено в форуме Python

Anonymous » 18 сен 2024, 14:02 » в форуме Python

У меня есть большой фрейм данных Polars, который я хотел бы разделить на n фреймов данных, учитывая размер. Например, возьмите фрейм данных и разделите его на 2, 3 или 5 фреймов данных.
Есть несколько наблюдений, которые будут отображаться для...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 14:02

Вернуться в «Python»