AssertionError:内部:未指定默认项目

2024-01-26

气流新手。尝试运行 SQL 并将结果存储在 BigQuery 表中。

出现以下错误。不确定在哪里设置default_rpoject_id。

请帮我。

Error:

Traceback (most recent call last):
  File "/usr/local/bin/airflow", line 28, in <module>
    args.func(args)
  File "/usr/local/lib/python2.7/dist-packages/airflow/bin/cli.py", line 585, in test
    ti.run(ignore_task_deps=True, ignore_ti_state=True, test_mode=True)
  File "/usr/local/lib/python2.7/dist-packages/airflow/utils/db.py", line 53, in wrapper
    result = func(*args, **kwargs)
  File "/usr/local/lib/python2.7/dist-packages/airflow/models.py", line 1374, in run
    result = task_copy.execute(context=context)
  File "/usr/local/lib/python2.7/dist-packages/airflow/contrib/operators/bigquery_operator.py", line 82, in execute
    self.allow_large_results, self.udf_config, self.use_legacy_sql)
  File "/usr/local/lib/python2.7/dist-packages/airflow/contrib/hooks/bigquery_hook.py", line 228, in run_query
    default_project_id=self.project_id)
  File "/usr/local/lib/python2.7/dist-packages/airflow/contrib/hooks/bigquery_hook.py", line 917, in _split_tablename
    assert default_project_id is not None, "INTERNAL: No default project is specified"
AssertionError: INTERNAL: No default project is specified

Code:

sql_bigquery = BigQueryOperator(
        task_id='sql_bigquery',
        use_legacy_sql=False,
        write_disposition='WRITE_TRUNCATE',
        allow_large_results=True,
        bql='''
            #standardSQL
                SELECT ID, Name, Group, Mark, RATIO_TO_REPORT(Mark) OVER(PARTITION BY Group) AS percent FROM `tensile-site-168620.temp.marks`
                ''',
        destination_dataset_table='temp.percentage',
        dag=dag
        )

编辑:我终于通过简单地添加解决了这个问题bigquery_conn_id='bigquery'在单独的 python 脚本中运行以下代码后,BigQueryOperator 任务中的参数。

显然,您需要在 Airflow UI 的 Admin -> Connection 中指定您的项目 ID。您必须以 JSON 对象的形式执行此操作,例如“project”:“”。

就我个人而言,我无法让网络服务器在 GCP 上运行,所以这是不可行的。这里有一个程序化的解决方案:

from airflow.models import Connection
from airflow.settings import Session

session = Session()
gcp_conn = Connection(
    conn_id='bigquery',
    conn_type='google_cloud_platform',
    extra='{"extra__google_cloud_platform__project":"<YOUR PROJECT HERE>"}')
if not session.query(Connection).filter(
        Connection.conn_id == gcp_conn.conn_id).first():
    session.add(gcp_conn)
    session.commit()

这些建议来自这里有一个类似的问题。 https://stackoverflow.com/questions/39178629/setting-up-airflow-with-bigquery-operator

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

AssertionError:内部:未指定默认项目 的相关文章

  • Python 字典不按顺序排列

    我创建了一个字母表字典 其值从0开始 并根据单词文件增加一定的量 我对最初的字典进行了硬编码 我希望它保持按字母顺序排列 但事实并非如此 我希望它按字母顺序返回字典 基本上与初始字典保持相同 我怎样才能保持秩序 from wordData
  • rpy2 在从 R 到 Python 的数据帧中处理 NA/缺失值时出现问题

    我在使用rpy2包进行转换时遇到问题dataframe将 R 中的内容保存到 Python 中 import os os environ R HOME Library Frameworks R framework Resources imp
  • IndexError:布尔索引与维度 0 上的索引数组不匹配

    在我将 Numpy 更新到 1 13 1 之前 我的代码工作正常 现在我收到以下错误 IndexError boolean index did not match indexed array along dimension 0 dimens
  • Python 2.7 将比特币私钥转换为 WIF 私钥

    作为一名编码新手 我刚刚完成了教程 教程是这样的 https www youtube com watch v tX XokHf nI https www youtube com watch v tX XokHf nI 我想用 1 个易于阅读
  • 了解 Python 中的酸洗

    我最近接到一项作业 需要以腌制形式放置一本字典 其中每个键引用一个列表 唯一的问题是我不知道腌制形式是什么 谁能给我指出一些好的资源的正确方向来帮助我学习这个概念 pickle 模块实现了一个基本但强大的算法 用于序列化和反序列化 Pyth
  • 如何将 self 传递给装饰器?

    我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
  • 如何在 robobrowser-python 中发出 POST 请求

    http robobrowser readthedocs org en latest api html http robobrowser readthedocs org en latest api html 我正在尝试使用 APIbrows
  • sqlalchemy 具有相同表名的多个数据库不起作用

    我正在使用 SQLAlchemy 使用 Python 处理两个数据库 这些数据库共享表名 因此在运行代码时收到错误消息 错误消息是 sqlalchemy exc InvalidRequestError Table wo is already
  • 如何进行重定向并保留查询字符串?

    我想进行重定向并保留查询字符串 就像是self redirect加上发送的查询参数 那可能吗 newurl my new route urllib urlencode self request params self redirect ne
  • 基于 Web 请求在 Airflow 上运行作业

    我想知道是否可以在通过 HTTP 收到请求时执行气流任务 我对 Airflow 的调度部分不感兴趣 我只是想用它来代替芹菜 因此 示例操作如下所示 用户提交一份表格 请求某些报告 后端接收请求并向用户发送请求已收到的通知 然后后端使用 Ai
  • pydev 断点不起作用

    我正在使用 python 2 7 2 sqlalchemy 0 7 unittest eclipse 3 7 2 和 pydev 2 4 开发一个项目 我在 python 文件 单元测 试文件 中设置断点 但它们被完全忽略 之前 在某些时候
  • Django 1.6 的静态文件

    我花了一整天但没有任何作用 我在这里看到了至少 20 篇关于同一主题的帖子 它们各不相同 有不同的建议 但没有一个对我有用 使用 Python 2 7 运行 Django 1 6 我正在尝试从 django 教程加载民意调查应用程序的 cs
  • 导入错误:没有名为 google.auth 的模块

    当我尝试导入时firebase admin in python 2 7我收到错误 导入错误 没有名为 google auth 的模块 这是Docker文件 https github com ammaratef45 Attendance bl
  • 安装 apache-airflow 时出错:“无法为使用 PEP 517 的 setproctitle 构建轮子,并且无法直接安装”

    我正在尝试寻找一些安装 apache airflow 的帮助 我使用的是 MacOS 10 15 7 Python 版本 3 8 2 并且不断收到错误 错误 无法为使用 PEP 517 的 setproctitle 构建轮子 并且无法直接安
  • 如何使用SQLAlchemy实现内连接?

    如何使用 SQLAlchemy 实现内连接 我正在尝试进行简单的聊天 class Base object def tablename self return self name lower id Column Integer primary
  • 在 Pandas Dataframe 中保存其他属性

    我记得在 MatLab 时代使用结构化数组 您可以将不同的数据存储为主结构的属性 就像是 a a A magic 10 a B magic 50 etc where a A and a B彼此完全独立 允许您在其中存储不同类型a并根据需要对
  • 如何在 Windows 上使用 Python 3.6 来安装 Python 2.7

    我想问一下如何使用pip install对于 Python 2 7 当我之前安装并使用 Python 3 6 时 我现在必须使用 Windows 上的 Python 版本 pip install 继续安装 Python 3 6 我需要使用以
  • Python Flask 是否定义了路由顺序?

    在我看来 我的设置类似于以下内容 app route test def test app route
  • 如何在日志中查看MySqlHook结果

    我在用MySqlHook建立连接气流数据库 并且我正在执行一些查询 但我需要在某处查看查询的结果 比如说日志 我怎样才能看到 这是示例代码 t1 MySqlOperator task id basic mysql mysql conn id
  • Python 将列表中的字符串转换为数字

    我遇到了以下错误消息 以 10 为基数的 int 的文字无效 2 2 外部用单引号括起来 内部用双引号括起来 该数据位于primes列出使用print primes 0 样本数据在primes list 2 3 5 7 The primes

随机推荐

  • 两个变量相减

    我正在使用 Jasper 报告设计我的报告 我有一份收入支出报告 其中我使用变量获得总收入TOT INCOME和使用第二个变量的总费用 TOT EXPENSES 我需要减去两个变量才能得到净利润 所以我创建了第三个变量TOT PROFIT
  • Cordova/Phonegap:WP8.1 导航栏重叠

    我的 cordova 应用程序是为 WP 8 0 Target 构建的 当在没有硬件按钮但有可切换导航栏的 WP8 1 设备上运行它时 HTML 内容会被导航栏重叠 隐藏导航栏时 导航栏的黑色背景将保留并仍然与 HTML 重叠 还可以滚动整
  • 如何在保存打印页面时为文件创建自定义文件名?

    在这里 我通过 window print 事件打印页面 在打印之前 我需要保存此页面 因为我需要在此事件中硬核文件名 a href img class noPrint src Images Print icon png border 0 a
  • 从测试台访问 uvm_config_db 的最佳方式?

    我想在我的顶级测试平台中创建一个时钟 其周期可以通过测试进行控制 我所做的是将周期设置到 uvm config db 中并将其返回到测试台中 我必须输入 1 以确保构建阶段已完成 否则 get 返回错误值 module testbench
  • CakePHP 连接在浏览器中被拒绝

    我正在第一次设置 学习 CakePHP 我正在努力弄清楚为什么我无法通过默认端口 8765 访问我的服务器 我喜欢在 ubuntu 机器上进行开发并远程处理代码 该服务器托管在我本地计算机上的虚拟机上 但我将其称为远程计算机 服务器和我的远
  • lua 垃圾收集器调试输出的最佳方法是什么?

    我需要一个游戏状态对象在 lua 中 不是 C 或与 C 绑定 管理来自我的 C 引擎的灯光 相机 对象 事件 lua 对象是与 c 不同的实体 几乎只是标准的 lua 表 我担心 GC 将如何删除这些对象 因为它们将被动态创建和删除 打开
  • 从真值表创建降序二元决策图 (ROBDD)

    是否有一个软件包 最好是应用程序 而不是库 可以根据给定的真值表 以某种文本格式 创建降序二元决策图 ROBDD 你也可以尝试这个 http formal cs utah edu 8080 pbl BDD php http formal c
  • Pygal 子图(几张图)

    我想在 python 2 7 上使用 Pygal 创建一个仪表板 同一窗口中的多个图 但后者没有 subplot 功能 有没有不使用散景或情节的解决方案 Matplotlib 上的示例 fig axes plt subplots ncols
  • 无法找到此循环的大 O 时间

    我正在尝试查找以下代码片段的 Big O 运行时间 for i 0 i lt n n i for j 0 j lt i j k 我不确定由于 n 的乘法 它是否会是 O n 3 或者只是 O n 2 一些帮助将不胜感激 内部循环将执行 0
  • 使用 AudioKit for iOS < 11 进行离线音频渲染

    我有 4 个AKPlayer节点 每个节点都连接到一些效果 最后它们混合在一起 我想离线渲染 iOS gt 9 0 的输出 但我不知道如何做 编辑 我已经实现了渲染并将其分离为 iOS gt 11 虽然 iOS gt 11 renderTo
  • 无法读取 null 的属性“getHostNode”

    我有一个带有 React 路由器的 Horizo n React 应用程序 并且我的应用程序中有一个简单的按钮 Another Search 当我点击它时 出现以下异常 Uncaught TypeError Cannot read prop
  • Redux Saga 异步/等待模式

    我在整个代码库中使用 async await 因此 我的 api 调用是由异步函数定义的 async function apiFetchFoo return await apiCall 我想从我的传奇代码中调用这个函数 看来我不能这样做 D
  • 用户看到深度嵌套状态的一部分,可见属性是否应该位于顶层?

    我正在开发一款游戏 最初 用户处于单个地牢中 具有以下属性 state health 95 creatures bigBoss lightIsOn true goldReward 54 you get the idea 现在有很多王国 很多
  • C# DateTime ToString 标准区域性格式

    我可以更改特定区域性的 DateTime 的标准输出格式吗 例子 class Program static void Main string args PrintCultureDateTime ca ES PrintCultureDateT
  • 防止圆圈重叠

    我正在尝试找出 JavaScript 数学来将两个碰撞的圆移开 该图像的左侧是我已经拥有的内容的视觉表示 x1 y1 x2 and y2 are the positions of the circles r1 and r2 are the
  • 如何在 HSQL Db 内存单元测试中启用引用完整性

    我对整个 JPA 后端进行了 200 多个单元测试 它们在 hsql db 2 2 上都运行良好 我在连续构建环境中运行测试来验证系统的稳定性 除了当我在 Oracle 11 上运行它们时 一些测试因引用完整性约束而失败 这是由于我的代码中
  • CSS 在悬停时从不同元素更改元素内容

    是否可以in CSS当鼠标悬停在不同的元素上时更改元素的内容 举例来说 我有这个 div A B C D E F 当我将鼠标悬停在 B 中时 我想在 A 中显示一些文本 如果我将鼠标悬停在 C 中 A 中将会出现不同的文本 其余的也一样 当
  • ag-grid支持列虚拟化吗?

    这在有很多列且大多数列不在可见区域的情况下特别重要 是的 正如上面所述文档 https www ag grid com javascript grid accessibility dom order 默认情况下 网格使用虚拟化 网格技术 当
  • 实例删除:此应用程序有一个待处理的操作。请稍候并重试

    我在 GAE Standard Java 中的一个实例不知何故处于一种奇怪的状态 尝试删除它会导致 此应用程序有一个待处理的操作 请等待并重试 很长时间 对于重新部署新版本这一问题是否有任何解决方案 有趣的 在 Appengine 上映射自
  • AssertionError:内部:未指定默认项目

    气流新手 尝试运行 SQL 并将结果存储在 BigQuery 表中 出现以下错误 不确定在哪里设置default rpoject id 请帮我 Error Traceback most recent call last File usr l