背景故事:我每天都在运行 Airflow 作业,其中包含start_date
2019 年 7 月 1 日。收集的作业从第三方请求每天的数据,然后将该数据加载到我们的数据库中。
成功运行作业几天后,我意识到第三方数据源每月只刷新一次数据。因此,我每天只是下载相同的数据。
那时,我改变了start_date
到一年前(以获取前几个月的信息),并将 DAG 的时间表更改为每月运行一次。
我如何(在气流 UI 中)完全重新启动 DAG,以便它识别我的新 DAGstart_date
并安排,并运行完整的回填,就好像 DAG 是全新的一样?
(我知道可以通过命令行请求此回填。但是,我没有命令行界面的权限,并且无法访问管理员。)
单击 Web 界面中相关作业的 Dag Runs 列中的绿色圆圈。这将为您带来所有成功运行的列表。
勾选列表标题左上角的复选标记以选择全部
实例,然后在上面的菜单中选择“选择”,然后在下拉菜单中选择“删除”。这应该清除所有现有的 dag 运行实例。
如果您的 Airflow 实例上未启用 catchup_by_default,请确保catchup=True
在 DAG 上设置,直到完成追赶。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)