Я новичок в Pandas и DataFrames и пытаюсь понять два подхода:Python

Программы на Python
Ответить
Anonymous
 Я новичок в Pandas и DataFrames и пытаюсь понять два подхода:

Сообщение Anonymous »

Я новичок в пандах и фреймах данных и пытаюсь понять два подхода:
1. Сравнение фреймов данных по заголовкам

Код: Выделить всё

import pandas as pd

# Example DataFrames
df1 = pd.DataFrame({
'id': [1, 2, 3],
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35]
})

df2 = pd.DataFrame({
'id': [2, 3, 4],
'name': ['Bob', 'Charlie', 'David'],
'age': [30, 36, 40]
})

# Find common keys
common_ids = set(df1['id']) & set(df2['id'])

# Align DataFrames on the key
df1_common = df1[df1['id'].isin(common_ids)].sort_values('id').reset_index(drop=True)
df2_common = df2[df2['id'].isin(common_ids)].sort_values('id').reset_index(drop=True)

# Find common columns (headers)
common_columns = [col for col in df1.columns if col in df2.columns and col != 'id']

# Compare all matching columns
for col in common_columns:
print(f"Differences in column '{col}':")
print(df1_common[col].values != df2_common[col].values)
2. Сравните с использованием Pandas Merge

Код: Выделить всё

import pandas as pd

def merge_compare(dataframe_1: pd.DataFrame, dataframe_2: pd.DataFrame) -> pd.DataFrame:
# Merge on 'id' with suffixes to distinguish columns
merged = pd.merge(
dataframe_1, dataframe_2,
on='id',
how='inner',
suffixes=('_df1', '_df2')
)

# Find common columns (excluding 'id')
headers_1 = set(dataframe_1.columns)
headers_2 = set(dataframe_2.columns)
comparison_columns = [col for col in headers_1 & headers_2 if col != 'id']

# For each common column, add a boolean column showing if values match
for col in comparison_columns:
merged[f'{col}_match'] = (
merged[f'{col}_df1'].fillna('').astype(str).str.strip().str.upper() ==
merged[f'{col}_df2'].fillna('').astype(str).str.strip().str.upper()
)

return merged
  • В чем разница между этими двумя методами?
  • Когда какой-либо из них лучше подходит для определенных случаев использования?


Подробнее здесь: https://stackoverflow.com/questions/798 ... approaches
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»