Я вижу, что происходит WriteOps. При дальнейшем исследовании я вижу, что создаются временные таблицы, и их количество продолжает увеличиваться.
Одно из наблюдений заключается в том, что команда, которую выполнил Glue, имеет тип Execute, а не Query.
Запрос не имеет любое предложениеwhere/groupby/order.
Я пытаюсь выяснить, почему это происходит и как повлияет на производительность, если я запущу его на рабочем экземпляре.
Я также попробовал просто выполнить запрос как есть
Код: Выделить всё
mysql -u admin -p -e "SELECT * FROM " \
--batch --silent --quick | sed 's/\t/,/g' > output.csv
Я думал о работе склеивания, поскольку было бы проще записать в формате паркета в s3 для дальнейшего использования.
Но меня беспокоят ненужные WriteOps. Можете ли вы помочь мне понять, почему запрос задания Glue приводит к записи, а также использую ли я подход записи для архивирования данных в S3?
Подробнее здесь: https://stackoverflow.com/questions/793 ... -through-g