Он создается следующим образом:
Код: Выделить всё
with tarfile.open(full_data_name, "w:gz", format=GNU_FORMAT) as tar_handle:
...
tar_handle.add(file_path)
Я знаю о pkgdiff, и он отлично работает, но я бы хотел сделать это на Python.
Я также знаю, что могу сделать это вручную, разархивируйте и заархивируйте файлы, загрузите содержимое и проверьте побайтно, но нет ли какого-нибудь более простого и менее требовательного к ресурсам метода?
Я пытался просто проверить содержимое tar файлы .gz (удаление метки времени в байтах 4-7), но это работает только иногда, поэтому я предполагаю, что есть какая-то случайная перетасовка в части tar или некоторая случайность в gz, поскольку pkgdiff говорит, что они одинаковы, но шестнадцатеричный редактор показывает много различий.
Подробнее здесь: https://stackoverflow.com/questions/790 ... -identical