Я написал небольшой скрипт Glue, который извлекает некоторые данные между двумя датами, но обнаружил, что он сканирует всю таблицу, а не только данные в указанном диапазоне времени. Я также попытался создать индекс в своей базе данных SQL, но это не имело никакого значения. Я не знаю, как создать индексацию или секционирование в AWS Glue.
SELECT *
FROM employee_management.employees
WHERE created_at >= '2025-11-11 23:00:00'
AND created_at < '2025-11-12 23:00:00';
Подробнее здесь: https://stackoverflow.com/questions/798 ... ate-filter