Я изучаю Apache Airflow и создал простую группу обеспечения доступности баз данных для получения ежедневных событий из REST API. Когда я вызываю API непосредственно в браузере, он правильно возвращает данные за один день
http://localhost:5000/events?start_date ... 2019-01-02
[
{
"date": "2019-01-01",
"user": "user1"
}
]
Однако, когда я вызываю тот же URL-адрес API с помощью Airflow BashOperator, выходной файл содержит данные с 1 января 2019 по 05 января 2019 года, что неожиданно.
dag = DAG(
dag_id="04_time_delta",
schedule_interval='@daily',
start_date=dt.datetime(2026,1,1)
)
fetch_events = BashOperator(
task_id ='fetch_events',
bash_command=(
"mkdir -p /Users/asadali/data/events && "
"curl -o /Users/asadali/data/events/events.json http://localhost:5000/events?"
"start_date=2019-01-01&"
"end_date=2019-01-02"
),
dag = dag
)
fetch_events
``` [enter image description here][1]
[1]: https://i.sstatic.net/bmmlRnuU.png
Подробнее здесь: https://stackoverflow.com/questions/798 ... -has-singl