Файл1: (df1)
Код: Выделить всё
column1 column2 column3 column4
ABC 100 020 030
DEF 200 040 050
GHI 300 001 002
Код: Выделить всё
column1 column2 column3 column4
ABC 100 060 070
DEF 200 040 090
Код: Выделить всё
column1 column2 column3 column4
ABC 100 020 | 060 030 | 070
DEF 200 . 050 | 090
GHI 300 001 002
Мой код выглядит так:
Код: Выделить всё
df = pd.concat([df1,df2], sort=False)
df.set_index(['column1', 'column2'], inplace=True)
df = df.replace(np.nan, '', regex=True)
def report_diff(x):
print(x)
return '.' if x[0] == x[1] else '{} | {}'.format(*x)
changes = df.groupby(level=['column1', 'column2']).agg(report_diff)
display(changes)
Ждем.
Подробнее здесь: https://stackoverflow.com/questions/788 ... -in-pandas