Мне нужно сравнить два фрейма данных с разными столбцами и найти различия между ними.
Хотя этот пример является числовым, мои данные — нет, я использую его как образец набора данных.< /p>
Мне нужно сравнить два фрейма данных с разными столбцами и найти различия между ними. Хотя этот пример является числовым, мои данные — нет, я использую его как образец набора данных.< /p> [code]import pandas as pd
for index, row in merged_df.iterrows(): for column in merged_df.columns: if column not in key_columns: prod_column = column + '_Prod' test_column = column + '_Test'
if prod_column in merged_df.columns and test_column in merged_df.columns: if row[prod_column] != row[test_column]: output = output.append({'Row': index, 'Column': column, 'Misaligned Data': (row[prod_column], row[test_column])}, ignore_index=True)
print(output) [/code] Это дает мне следующий результат: [code]Project.name Line identifier Column1_Prod Column2_Prod Column1_Test Column2_Test Column3 0 Project A 1 10.0 100.0 10.0 100.0 100.0 1 Project B 2 20.0 200.0 20.0 200.0 200.0 2 Project C 3 30.0 300.0 35.0 350.0 350.0 [/code] Я хотел бы, чтобы результат был следующим: [code]Project.Name, Line identifier Prod Test Project C 3 30 35 Project A 1 100 NaN Project A 2 200 NaN Project A 3 250 NaN [/code] Я ищу только различия между фреймами данных.
Я хочу провести модульное тестирование своих скриптов AWS Glue. Я использую Python и Pyspark. Я хочу объединить функции модульного тестирования, использующие динамические фреймы и фреймы данных. Мне не нужно взаимодействовать с AWS или передавать...
У меня есть функция extract_redundant_values для извлечения избыточных строк из кадра данных pandas. Я тестирую его, запуская in_df для создания out_df. Затем я сравниваю это с ожидаемым результатом ожидаемого_out_df. Кажется, они имеют одинаковый...
У меня есть функция extract_redundant_values для извлечения избыточных строк из кадра данных pandas. Я тестирую его, запуская in_df для создания out_df. Затем я сравниваю это с ожидаемым результатом ожидаемого_out_df. Кажется, они имеют одинаковый...