使用流 API 更新新列后无法将新值插入 BigQuery 表

2024-03-25

我在 bigquery 表中发现了一些奇怪的行为，我刚刚创建了一个新列，在表中添加了一个新列，它在界面上看起来不错，并通过 api 获取架构。

但是，当向新列添加值时，出现以下错误：

{
  "insertErrors" : [ {
    "errors" : [ {
      "message" : "no such field",
      "reason" : "invalid"
    } ],
    "index" : 0
  } ],
  "kind" : "bigquery#tableDataInsertAllResponse"
}

我正在使用 java 客户端和流 API，我唯一添加的是：

tableRow.set("服务器时间戳", 0)

没有那条线它可以正常工作:(

您发现它有什么问题吗（列的名称是 server_timestamp，它被定义为 INTEGER）

自 2014 年 8 月最初回答此问题以来，BigQuery 的流式传输系统已经发生了重大更新，因此更新了此答案。

BigQuery 的流式处理系统会将表架构缓存最多 2 分钟。当您将字段添加到架构中，然后立即将新行流式传输到表中时，您可能会遇到此错误。

避免此错误的最佳方法是在修改表后延迟流式传输具有新字段的行 2 分钟。

如果这不可能，您还有其他一些选择：

Use the ignoreUnknownValues选项。该标志将告诉插入操作忽略未知字段，并仅接受它识别的那些字段。设置此标志允许您立即开始使用新字段流式传输记录，同时避免在 2 分钟窗口内出现“无此类字段”错误 - 但请注意，新字段值将被静默删除，直到缓存的表架构更新！
Use the skipInvalidRows选项。该标志将告诉插入操作插入尽可能多的行，而不是在检测到单个无效行时使整个操作失败。如果只有部分数据包含新字段，则此选项很有用，因为您可以继续使用旧格式插入行，并单独决定如何处理失败的行（使用ignoreUnknownValues或者等待 2 分钟窗口过去）。

如果您必须捕获所有值并且不能等待 2 分钟，则可以使用更新的架构创建一个新表并流式传输到该表。这种方法的缺点是您需要管理由此方法生成的多个表。请注意，您可以使用以下方式方便地查询这些表TABLE_QUERY，并且您可以运行定期清理查询（或表副本）以将数据合并到单个表中。

历史记录：此答案的先前版本建议用户停止流式传输，将现有数据移动到另一个表，重新创建流式传输表，然后重新启动流式传输。但是，由于这种方法的复杂性以及架构缓存窗口的缩短，BigQuery 团队不再推荐这种方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

googlebigquery

使用流 API 更新新列后无法将新值插入 BigQuery 表的相关文章

如何在 BigQuery 中扩展数据透视？

假设我有给定日期的音乐视频播放统计表 mydataset stats 3B 行 100 万用户 6K 艺术家简化的架构是用户GUID字符串艺术家GUID字符串我需要将艺术家从行转置到列因此模式将是 UserGUID 字符串 Art
使用 Airflow 将 mysql 数据加载到 bigquery 的 dag 出现“无效参数传递”错误

我运行一个 DAG 提取 MySQL 数据并将其加载到气流中的 BigQuery 我目前收到以下错误 usr local lib python2 7 dist packages airflow models py 1927 PendingD
根据行内容指定动态生成的表名

我想设置从 gcs 存储桶中的文件读取数据流管道然后写入 bigquery 表需要注意的是要写入的表应根据从 gcs 文件中读取的行的内容来决定我的问题是这可能吗如果是有人可以给我任何关于如何实现这一目标的提示吗此外必须进
BigQuery 是否支持“立即执行”命令来运行动态查询？

我可以在 Oracle 中编写这样的代码使用动态创建表立即执行 sql 查询命令 create or replace function make a table1 p table name varchar2 p column nam
apache beam.io.BigQuerySource use_standard_sql 作为数据流运行程序运行时不起作用

我有一个数据流作业我将首先从 bigquery 查询中读取在标准 sql 中它在直接运行模式下完美运行但是我尝试在数据流运行程序模式下运行此数据流并遇到此错误响应 content 显然 use standard sql 参数在数
BigQuery JDBC 驱动程序返回的行数不会超过 100,000 行

我在 Pentaho PDI 中使用 Google BigQuery 的 starschema JDBC 驱动程序 http code google com p starschema bigquery jdbc http code goog
计算 SQL 中特定事件之前和之后的事件数量？

我有一个包含日期和事件的表有一个名为 A 的事件我想知道 Sql Bigquery 中事件 A 之前和之后发生了多少个事件例如 User Date Events 123 2018 02 13 D 123 2018 02 12 B 12
如何从数据流中的PCollection读取bigQuery

我有一个从 pubsub 获得的对象 PCollection 比如说 PCollection
Cloud SQL 增量到 BigQuery

我需要针对我正在研究的用例之一提供一些建议使用案例我们在 Cloud SQL 中拥有大约 5 10 个表的数据其中一些被视为查找表另一些则被视为事务性表我们需要将其发送到 BigQuery 以生成 3 4 个表扁平化嵌套或非规
Python：如何在 40 秒内更新 Google BigQuery 中的值？

我有一张桌子在Google BigQuery我使用 Python 访问和修改pandas功能read gbq and to gbq 问题是追加 100 000 行大约需要 150 秒而追加 1 行大约需要 40 秒我想更新表中的值而不是
Bigquery 如果字段存在

简而言之有没有办法在不存在的 BQ 字段中进行查询并接收这些字段的 null 值我有几乎同样的问题BigQuery IF 字段存在 THEN https stackoverflow com questions 32276601 big
BigQuery 无法将字段的“null”解析为 int

尝试将 csv 文件加载到 bigquery 表中有些列的类型为 INTEGER 但某些缺失值为 NULL 所以当我使用命令 bq load 加载时出现以下错误无法将 null 解析为字段的 int 所以我想知道处理这个问题的最佳解决
有没有办法在 BigQuery 标准 SQL 中添加连接表名？

我想知道是否可以强制标准 SQL 在连接表名前面加上前缀以便我可以从 a 和 b 中获取带有 a 和 b 前缀的所有字段而无需手动命名每个字段 IE 我想做一个SELECT 我不想生成每个字段名我知道如果您从旧版 SQL 切换到标准
同一项目中的不同用户是否可以拥有不同的 BigQuery 配额？

同一项目中的不同用户是否可以拥有不同的 BigQuery 配额我知道我可以通过 GCP 的 IAM 和管理部分对给定项目的每个用户每天的查询使用量设置限制以下这些说明 https cloud google com bigquery
oauth2client.client.AccessTokenRefreshError: invalid_grant 仅在 Docker 中

我有相同的代码具有相同的 p12 文件检查了 md5 和相同的 account email 和相同的范围可以在多台计算机上工作但不能在任何工作计算机上的 Docker 容器中工作我的代码片段如下 with open self p
Google Big Query 错误：CSV 表遇到太多错误，放弃。行：1 错误：1

I am trying to run a query on a 12 GB csv file loaded in Google big query I cant run any query on the dataset I am not s
如何获取有权访问bigquery中的表的所有用户/组/服务帐户

from pprint import pprint from google oauth2 import service account import googleapiclient discovery credentials service
BigQuery Crashlytics - 无崩溃的用户/会话

我已将 firebase crashlytics 数据链接到 bigquery 并设置 google 提供的数据工作室模板除了我的仪表板所需的最重要的指标之外还有很多重要的数据无崩溃用户 and 无崩溃会话以百分比表示在我可以用来计
如何从 firebase 导出无崩溃的用户？

我想将有关崩溃和无崩溃用户指标的数据保留在数据库中以供进一步分析我已经将该项目链接到 BigQuery 但找不到计算方法无崩溃用户BigQuery 中包含的数据价值是否可以以某种方式导出无崩溃的用户指标这里是 Fabric Fireb
Google BigQuery：如何使用 SQL 创建新列

我想在不使用旧版 SQL 的情况下向现有表添加一列基本的 SQL 语法是 ALTER TABLE table name ADD column name datatype 我格式化了 Google BigQuery 的查询 ALTER TA

随机推荐

Java RMI 资源

我目前正在进行一个涉及广泛使用 Java RMI 的项目我想知道是否有人知道有关它的任何好的资源我目前找到的材料所遇到的问题是它通常已经过时如 Java 1 3 和或半完整我什至很乐意买一本关于它的书但在亚马逊上看所有的书都已
通过 apache modwsgi 运行时如何制作 Bottle 打印堆栈跟踪？

当 Bottle 作为独立服务器运行时这很容易做到 from bottle import run Bottle run app app host config get bottle host localhost port config g
FILAB VM 与 Cosmos 全局实例之间的连接问题

我遇到了问题中讨论的相同类型的连接问题 Cygnus 无法在 Cosmos 全局实例上保留数据 https stackoverflow com questions 33674713 cygnus can not persist data o
如何修复此错误：结构“Utf8”为空。不推荐使用对空结构的支持...使用 Opaque 代替

我最近在运行我的应用程序时开始收到此错误它似乎并没有影响一切但它在日志中非常嘈杂和烦人我没有更改任何内容或向我的应用程序添加任何内容这会导致类似的情况我最近做的唯一一件事就是升级到 Flutter 的最新版本我经常升级所以距离
查看 Intellij 项目中的错误[重复]

这个问题在这里已经有答案了我使用的是 Intellij 版本 8 如何查看整个项目的警告或错误 UPDATE See 这个答案 https stackoverflow com a 19366569 104891这是最新的这里最初的答案是
如何从 Mono 证书存储“我的”和“信任”中删除/删除证书？

我已在 Linux 中使用以下命令将证书添加到 Mono 3 2 8 存储中 certmgr add c m My mycert cer 添加的证书可以通过以下方式查看 certmgr list c m My mycert cer 使用以下
如何在 MySQL CASE 表达式中使用“OR”条件？

我有一个包含 CASE 表达式语句的过程如下所示 BEGIN WHILE counter lt total DO CASE ranking WHEN 1 OR 51 OR 100 OR 167 THEN SET project name
如何创建通用 Func 委托

我有这个方法 public static T F
对 Slack API 返回的“(400) Bad Request”进行故障排除

我们使用 slack API 一段时间了从 Jenkins 内的 powershell 调用它一切都工作正常这些消息具有格式并使用一些链接最近一些消息无法通过返回 400 Bad Request 如果我从日志中获取失败的内容并手
如何使用dispatchQueue创建引用循环？

我觉得我一直误解了创建引用循环的时间在我以前认为几乎任何有块并且编译器都会强迫你编写的地方 self那么这是我正在创建引用循环并且需要使用的标志 weak self in 但以下设置不会创建引用循环 import Foundation i
带有部分粗体文本的自定义 UITableViewCell

尝试实现类似于内置联系人 iPhone 应用程序的名称 UITableView 其中名字为普通字体姓氏为粗体快速谷歌一下后发现这并不像听起来那么容易因为 iPhone SDK 缺乏 UILabels 中的富文本支持找到的解决方案之
在本地主机上运行时 Google Optimize 不会触发

我正在尝试通过以下方式在 JavaScript 中获取 Google Optimize 实验数据这些说明 https support google com optimize answer 9059383 但我没有得到回调也看不到调试器中发
Go的修订历史背后有什么故事？

我注意到前 4 次修订f6182e5abf5e b66d0bf8da3e ac3363d7e788 172d32922e72Go 源代码都早在 Golang 被提出之前就已经存在了最古老的是1972年 https github com g
有没有什么方法可以禁用 ORMLite 检查使用 DataType.SERIALIZABLE 声明的字段是否实现了可序列化？

问题标题已经说明了一切我有一个这样声明的字段 DatabaseField canBeNull false dataType DataType SERIALIZABLE List
Azure Blob 存储 blob 到索引

是否可以将文档上传到 Blob 存储并执行以下操作获取文档内容并添加到索引从第 1 点的内容中抓取关键短语并添加到索引中我希望关键短语可以被搜索我有代码可以将文档上传到 blobstorage 效果非常好但获得此索引的唯一方法据
无法使用 primeng 虚拟滚动延迟加载

我正在尝试使用 primeng 对大量数据实现延迟加载
如何在 PDFsharp 中设置 DPI（每英寸点数）

有没有办法在 PDFsharp 的情况下设置 DPI 每英寸点数 Thanks 不 PDF 文件是没有 DPI 的矢量文件如果您的问题是关于 PDF 文件中存储的图像 PDFsharp 在图像出现时对其进行存储 PDFsharp 尚未通过
将平方和立方项转换为乘法

我正在尝试使用 sympy 中的 ccode 将来自 sage 的大表达式转换为有效的 C 代码然而我的表达式有很多平方和立方项由于 pow x 2 比 x x 慢得多因此我尝试在转换之前在表达式中扩展这些术语基于this htt
如何让两个雷神任务共享选项？

有了托尔人们就可以使用method option https github com wycats thor wiki Method Options设置特定任务的选项要为班级中的所有任务设置选项可以使用class option 但是如
使用流 API 更新新列后无法将新值插入 BigQuery 表

我在 bigquery 表中发现了一些奇怪的行为我刚刚创建了一个新列在表中添加了一个新列它在界面上看起来不错并通过 api 获取架构但是当向新列添加值时出现以下错误 insertErrors errors message no

使用流 API 更新新列后无法将新值插入 BigQuery 表

使用流 API 更新新列后无法将新值插入 BigQuery 表 的相关文章

随机推荐

热门标签

使用流 API 更新新列后无法将新值插入 BigQuery 表的相关文章