Проблема с индексом при слиянии двух наборов данных

Проблема с индексом при слиянии двух наборов данных ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Проблема с индексом при слиянии двух наборов данных

Цитата

Сообщение Anonymous » 16 окт 2024, 01:14

Мне нужен фрейм данных:
df_recap:
[img]https://i .sstatic.net/KnV5JuKG.png[/img]

и df23:

Мне нужно скопировать «Количество» и «единицу измерения» из df23 в df_recap для этого списка кода (тип код Л2.3). Может присутствовать 2 или более элемента кода в df23 (в этом случае измеренная_единица уникальна, а количество представляет собой сумму значений/записей).

С помощью этого кода:
`

Код: Выделить всё

# Carica i file CSV
df_semifinal = pd.read_csv('SemiFinal.csv')
df_l23 = pd.read_csv('L23.csv')

# 1. Raggruppa il dataset df_l23 per 'code', somma le quantità e mantiene il valore unico di 'measurement_unit'
df_l23_grouped = df_l23.groupby('code').agg({
'quantity': 'sum',                   # Somma i valori di 'quantity'
'measurement_unit': 'first'           # Mantiene il primo valore di 'measurement_unit' (assumendo sia uguale per lo stesso code)
})

# 2. Filtra le righe di df_semifinal dove 'Tipo Voce' è 'L2.3' e le colonne 'Quantità' o 'Unità di misura' sono NaN o '/'
mask = (df_semifinal['Tipo Voce'] == 'L2.3') & (
df_semifinal['Quantità'].isna() | df_semifinal['Quantità'].eq('/') |
df_semifinal['Unità di misura'].isna() | df_semifinal['Unità di misura'].eq('/')
)

# 3. Unisci il dataset df_semifinal con df_l23_grouped in base al 'Codice' di df_semifinal e 'code' di df_l23_grouped
df_merged = pd.merge(df_semifinal[mask], df_l23_grouped, left_on='Codice', right_on='code', how='left')

# 4. Sostituisci i valori mancanti o '/' nelle colonne 'Quantità' e 'Unità di misura' con i dati da df_l23_grouped
df_semifinal.loc[mask, 'Quantità'] = df_merged['quantity']
df_semifinal.loc[mask, 'Unità di misura'] = df_merged['measurement_unit']

# 5. Rimuovi eventuali colonne in eccesso come 'code' se non necessarie
df_semifinal.drop(columns=['code'], inplace=True, errors='ignore')

# 6. Salva il dataset aggiornato
df_semifinal

похоже, что возникла проблема с индексом:
[img]https://i .sstatic.net/WPHI59wX.png[/img]

значение L2.3 A.01.01.01 должно быть Quantity = 1 и A.02.01.01 Quantity = 1,36
Спасибо

Подробнее здесь: https://stackoverflow.com/questions/790 ... 2-datasets

1729030457

Anonymous

Мне нужен фрейм данных:
df_recap:
[img]https://i .sstatic.net/KnV5JuKG.png[/img]

и df23:
[img]https ://i.sstatic.net/826MLgzT.png[/img]

Мне нужно скопировать «Количество» и «единицу измерения» из df23 в df_recap для этого списка кода (тип код Л2.3). Может присутствовать 2 или более элемента кода в df23 (в этом случае измеренная_единица уникальна, а количество представляет собой сумму значений/записей).
[img]https://i.sstatic.net/EDYvDRtZ.png[/img]

С помощью этого кода:
` 
[code]# Carica i file CSV
df_semifinal = pd.read_csv('SemiFinal.csv')
df_l23 = pd.read_csv('L23.csv')

# 1. Raggruppa il dataset df_l23 per 'code', somma le quantità e mantiene il valore unico di 'measurement_unit'
df_l23_grouped = df_l23.groupby('code').agg({
'quantity': 'sum',                   # Somma i valori di 'quantity'
'measurement_unit': 'first'           # Mantiene il primo valore di 'measurement_unit' (assumendo sia uguale per lo stesso code)
})

# 2. Filtra le righe di df_semifinal dove 'Tipo Voce' è 'L2.3' e le colonne 'Quantità' o 'Unità di misura' sono NaN o '/'
mask = (df_semifinal['Tipo Voce'] == 'L2.3') & (
df_semifinal['Quantità'].isna() | df_semifinal['Quantità'].eq('/') |
df_semifinal['Unità di misura'].isna() | df_semifinal['Unità di misura'].eq('/')
)

# 3. Unisci il dataset df_semifinal con df_l23_grouped in base al 'Codice' di df_semifinal e 'code' di df_l23_grouped
df_merged = pd.merge(df_semifinal[mask], df_l23_grouped, left_on='Codice', right_on='code', how='left')

# 4. Sostituisci i valori mancanti o '/' nelle colonne 'Quantità' e 'Unità di misura' con i dati da df_l23_grouped
df_semifinal.loc[mask, 'Quantità'] = df_merged['quantity']
df_semifinal.loc[mask, 'Unità di misura'] = df_merged['measurement_unit']

# 5. Rimuovi eventuali colonne in eccesso come 'code' se non necessarie
df_semifinal.drop(columns=['code'], inplace=True, errors='ignore')

# 6. Salva il dataset aggiornato
df_semifinal
[/code]
похоже, что возникла проблема с индексом:
[img]https://i .sstatic.net/WPHI59wX.png[/img]

значение L2.3 A.01.01.01 должно быть Quantity = 1 и A.02.01.01 Quantity = 1,36
Спасибо 

Подробнее здесь: [url]https://stackoverflow.com/questions/79091898/problem-with-index-during-merge-of-2-datasets[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Я хотел бы знать, как избежать ненужного дублирования при сравнении двух данных в слиянии Pandas.

Последнее сообщение Anonymous « 15 окт 2024, 10:02
Добавлено в форуме Python

Anonymous » 15 окт 2024, 10:02 » в форуме Python

import pandas
df1 = pandas.DataFrame(
{
'code': ,
'name': ,
'date': ,
'value1': ,
'value2': ,
'sum':
}
)
df2 = pandas.DataFrame(
{
'code': ,
'name': ,
'date': ,
'value1': ,
'value2': ,
'sum':
}
)
result = pandas.merge(df1, df2, on= , how='outer',...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
15 окт 2024, 10:02
Свойство [имя] не существует в этом экземпляре коллекции в laravel при слиянии двух массивов

Последнее сообщение Anonymous « 11 апр 2024, 06:47
Добавлено в форуме Php

Anonymous » 11 апр 2024, 06:47 » в форуме Php

В laravel я столкнулся с этой проблемой при использовании слияния массива в контроллере. Мне приходится использовать его, потому что я хочу показать данные из обоих массивов и показать их в одной таблице laravel. Как мне устранить эту ошибку и что...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
11 апр 2024, 06:47
Перечислите все доступные имена наборов данных, содержащиеся в наборе данных наборов данных Hugginface.

Последнее сообщение Anonymous « 11 окт 2024, 19:56
Добавлено в форуме Python

Anonymous » 11 окт 2024, 19:56 » в форуме Python

Я хочу знать, какие наборы данных включены, например. эта коллекция наборов данных Huggingface:

m4_daily и weatherbench_daily упоминаются явно, но их должно быть больше .
Меня не интересует список всех таких коллекций.
Я получаю список через...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
11 окт 2024, 19:56
Stylus css Как показать объединенные хеши при слиянии?

Последнее сообщение Anonymous « 20 апр 2024, 08:14
Добавлено в форуме CSS

Anonymous » 20 апр 2024, 08:14 » в форуме CSS

С помощью следующего CSS-кода стилуса
foo = { '--width': 10px, height: 20px }

$my_colors={}

$red_colors={
'--red-1': red,
'--red-2': pink
}

$blue_colors={
'--blue-1': blue,
'--blue-2': cyan
}

.test{
{foo}
{merge($my_colors, $red_colors,...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
20 апр 2024, 08:14
SQLAlchemy - связь приводит к сбою ограничения UNIQUE при слиянии

Последнее сообщение Anonymous « 23 окт 2024, 02:23
Добавлено в форуме Python

Anonymous » 23 окт 2024, 02:23 » в форуме Python

Это может быть немного сложный вопрос, поэтому, пожалуйста, потерпите. Я нашел решение, которое работает, но думаю, что оно может быть ненадежным, и буду признателен за советы о том, как его улучшить.
Я создаю ORM для тестовой системы. . Базовая...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 02:23

Вернуться в «Python»