Код: Выделить всё
/user/test/data/data_backlog
Код: Выделить всё
dt=2023.01.01
part1.avro
part2.avro
dt=2023.01.02
part1.avro
part2.avro
Код: Выделить всё
/user/test/data/data_backlog_backup
Код: Выделить всё
# get directory list to be moved
directories = get_list_path(end_date, lake.listStatus(spark._jvm.org.apache.hadoop.fs.Path('/user/test/data/data_backlog')),False)
for _par in directories:
df_bkp = spark.read.format('avro').load(_par)
DataIO.write(df_bkp.coalesce(5), "data_backlog", "overwrite")
lake.Delete(fs.Path(_par), True)
Как сохранить ту же структуру папок в пути назначения
п>
Подробнее здесь: https://stackoverflow.com/questions/791 ... ng-pyspark