希望为部门团队实现一个简单的数据存储,他们目前在其中管理大量 excel/csv 文件。我们将让他们准备文件并将它们以 CSV 格式放入 GCS 存储桶中,然后将外部 BQ 表指向此(一切都很好)。
但是,如果他们运行查询并看到一些数据,然后想要找到该数据实际上是从哪里提取的,我们如何找出(假设文件名中没有上下文线索)哪个文件包含以下行问题?
您可以使用 _FILE_NAME 伪列来查看外部表的行所属的文件。请注意,伪列仅适用于外部表。例子:
bq query --external_table_definition=externalTable::AVRO=gs://mybucket/f* 'SELECT _FILE_NAME as f FROM externalTable'
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)