如何列出项目中的所有表格大小

2023-12-04

有没有办法列出 BigQuery 中的所有表大小？

我知道这样的命令：

select 
  table_id,
  sum(size_bytes)/pow(10,9) as size
from
  certain_dataset.__TABLES__
group by 
  1

但我想知道所有数据集中的所有表。

Thanks

随着 2020 年 BigQuery 脚本引入动态 SQL，这个问题变得容易一些。现在，我们可以动态构建查询并通过EXECUTE IMMEDIATE.

对于所有数据集都在的大多数情况，类似的事情会做region-us:

DECLARE dataset_names ARRAY<STRING>;

SET dataset_names = (
    SELECT ARRAY_AGG(SCHEMA_NAME) FROM `region-us.INFORMATION_SCHEMA.SCHEMATA`
);

EXECUTE IMMEDIATE (
    SELECT STRING_AGG(
        (SELECT """
            SELECT project_id, dataset_id, table_id, row_count, size_bytes 
            FROM `""" || s || 
            """.__TABLES__`"""), 
            " UNION ALL ")
    FROM UNNEST(dataset_names) AS s);

如果存在大量数据集，则在尝试同时读取所有元数据时可能会返回速率限制错误。

如果发生这种情况，那么我们可以依靠“批处理”方法，这种方法读取起来有点复杂，速度较慢/效率较低，但仍然可以完成工作：

DECLARE dataset_names ARRAY<STRING>;
DECLARE batch ARRAY<STRING>;
DECLARE batch_size INT64 DEFAULT 25;

CREATE TEMP TABLE results (
    project_id STRING,
    dataset_id STRING,
    table_id STRING,
    row_count INT64,
    size_bytes INT64
);

SET dataset_names = (
        SELECT ARRAY_AGG(SCHEMA_NAME) 
        FROM `region-us.INFORMATION_SCHEMA.SCHEMATA`
    );

LOOP
    IF ARRAY_LENGTH(dataset_names) < 1 THEN 
        LEAVE;
    END IF;

    SET batch = (
        SELECT ARRAY_AGG(d) 
        FROM UNNEST(dataset_names) AS d WITH OFFSET i 
        WHERE i < batch_size);

    EXECUTE IMMEDIATE (
        SELECT """INSERT INTO results """ 
            || STRING_AGG(
                    (SELECT """
                        SELECT project_id, dataset_id, table_id, row_count, size_bytes 
                        FROM `""" || s || """.__TABLES__`"""), 
                " UNION ALL ")
        FROM UNNEST(batch) AS s);

    SET dataset_names = (
        SELECT ARRAY_AGG(d) 
        FROM UNNEST(dataset_names) AS d
        WHERE d NOT IN (SELECT * FROM UNNEST(batch)));
        
END LOOP; 

SELECT * FROM results;

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

googlebigquery

如何列出项目中的所有表格大小的相关文章

Bigquery 如果字段存在

简而言之有没有办法在不存在的 BQ 字段中进行查询并接收这些字段的 null 值我有几乎同样的问题BigQuery IF 字段存在 THEN https stackoverflow com questions 32276601 big
Google Big-query api 403-禁止异常

当我使用 Big Query API 的 java 应用程序执行查询时出现以下 JSON 异常以下是我得到的异常 error errors domain global reason accessDenied message Access
如何使用 BigQuery 提取 JSON 对象中的所有键

BigQuery 具有在实时交互式查询中解析 JSON 的功能只需将 JSON 编码的对象存储为字符串然后使用 JSON EXTRACT SCALAR 等函数进行实时查询但是我无法找到一种方法来发现这些对象中的所有键属性我可以为
BigQuery中有新数据时触发云功能

我想在新数据导入 BigQuery 表时触发 Cloud Function 理想情况下我想提取已插入的所有行一列是 ISIN 这可能吗如何实现 2022 年 6 月更新第二代 Cloud Functions 支持Eventarc h
Google Analytics“用户计数”与大查询“用户计数”不匹配

我们的 Google Analytics 用户计数与我们的大查询用户计数不匹配我计算得正确吗通常 GA 和 BQ 非常接近尽管不完全一致最近 GA 与 BQ 中的用户数并不一致我们的每个用户的会话数通常非常正常分配在过
Bigquery 中的动态 UnPivot

我想使用 bigquery 脚本动态地将列反转为行我正在尝试复制我们所拥有的here https towardsdatascience com pivot in bigquery 4eefde28b3be但使用 upivot 运算符 Th
保存到 parquet 文件时如何使用新的 Int64 pandas 对象

我正在使用 Python Pandas 将数据从 CSV 转换为 Parquet 以便稍后将其加载到 Google BigQuery 中我有一些包含缺失值的整数列从 Pandas 0 24 0 开始我可以将它们存储为 Int64 dt
Google Big Query 错误：CSV 表遇到太多错误，放弃。行：1 错误：1

I am trying to run a query on a 12 GB csv file loaded in Google big query I cant run any query on the dataset I am not s
如何获取有权访问bigquery中的表的所有用户/组/服务帐户

from pprint import pprint from google oauth2 import service account import googleapiclient discovery credentials service
使用 Airflow BigqueryOperator 向 BigQuery 表添加标签

我必须向 bigquery 表添加标签我知道可以通过 BigQuery UI 来完成此操作但如何通过气流运算符来完成此操作 Use case 用于计费和搜索目的由于多个团队在同一项目和数据集下工作我们需要将各个团队创建的所有表组合在
Firebase BigQuery 导出 - 历史数据

当我尝试在 BigQuery 上搜索事件的历史数据时我只能找到上周的事件我无法在任何地方找到信息是否正确或者我做错了什么基本上我似乎只能查询过去一周的 events YYYYMMDD 它是否正确您是否有机会在一周前从 Fireba
Google BigQuery 另存为表

我用 Google BigQuery 运行了这个查询 SELECT repo id count as count FROM TABLE DATE RANGE githubarchive day events TIMESTAMP 2015 0
从 ISO 周中提取日期 (201905) BigQuery

我需要从 ISO 周数中提取星期日的日期即 201905 它需要位于 standardSQL 中因为它将使用不支持旧版本的脚本进行调度我尝试从 Google Sheets 调整工作公式但无法弄清楚 Google Sheets 的原始
如何使用 CLI bq 命令创建一次性数据集副本（无计划重复）

我想使用 bash 脚本在 BigQuery 中制作一次性数据集复制来自source dataset A to target dataset B This operation is easy to do in BigQuery Conso
导出BQ表时是否可以指定CSV引号字符？

我使用以下命令导出表bq extract destination format CSV compression GZIP noprint header table table
从 BigQuery 中删除停用词？

我有一大堆来自 reddit 的评论这些字符串被分割成单词删除标点符号并进行量化以显示特定 subreddit 上最常用的单词 SELECT word COUNT as num words FROM FLATTEN SELECT SP
如何在 BigQuery 中将列数据拆分为每 6 个字符并形成行

我需要将列数据拆分为每 6 个字符 Input col1 col2 d1 X11 F11 1000KG123456 d2 X22 F22 3500Kabcdefgh Expecting col1 col2 d1 X11 d1 F11 d1
BigQuery - 可以查询列数据类型

是否有一个函数可以让我们查询 BigQuery 中列的数据类型我想找到这样的东西 WITH basket AS SELECT apple AS fruit 10 AS qty UNION ALL SELECT pear AS fruit
如何从 BigQuery API 获取列名称？

我可以使用以下代码获取列值 os environ GOOGLE APPLICATION CREDENTIALS C Users xxx Desktop key json bq client Client query SELECT msts
Firebase 中的每用户会话分布表

这是第二篇文章我的后续文章第一篇文章 https stackoverflow com questions 48670590 session duration distribution table in firebase 查看 Fireba

随机推荐

如何使用 Tesseract 对图像进行 OCR

我开始学习 OpenCV 和 Tesseract 并且在一个看似非常简单的示例上遇到了麻烦这是我尝试 OCR 的图像内容为 171 m 我做了一些预处理由于蓝色是文本的主色因此我提取蓝色通道并应用简单的阈值处理 img cv2 im
执行Excel4Macro从关闭的工作簿中获取范围/图表

我使用这些行从关闭的工作簿中获取值 Arg Path File Sheet R4C4 Arg CStr Arg GetValue ExecuteExcel4Macro Arg 除了循环之外还有其他方法从范围中获取值吗循环解决方案正在工作
JavaScript 原型不工作

嗨我不知道这是否是我理解 Javascript 原型对象的错误需要明确的是我对 Javascript 单例概念很陌生并且缺乏明确的知识但是通过一些推荐网站我为我的系统制作了示例代码但它给出了一些错误我找不到原因所以我我请
Android 创建位图时出现 OutOfMemory 错误

我收到错误java lang OutOfMemoryError bitmap size exceeds VM budget 当为了手动绘制折线图而创建位图时会发生这种情况 width display getWidth 10 height w
Jenkins 日志变得巨大并填满了整个磁盘空间

每周我都会惊讶地发现我的 Jenkins 服务器达到了 Jenkins 日志使用的 100 磁盘所以我删除了该文件然后我的磁盘再次获得大量可用空间 ec2 user ip xxx xxx xxx xxx df h Filesystem
如何将环境设置导入到我的 Perl 程序中？

我有一个脚本其内容只是导出 Linux 中的一个变量 export LD LIBRARY PATH 我想在我的 Perl 脚本中运行这个脚本这样无论是谁运行我的 Perl 脚本都会有他们的LD LIBRARY PATH放我可以在 Pe
初级ILNumerics：VS2012下安装

我对 ILNUmerics 非常感兴趣想尝试免费版本但我遇到了麻烦我已经从控制台应用程序开始并尝试运行 hello ilnumerics 控制台应用程序但我注意到 VS 无法找到 MKL 库我在 Windwos 8 下使用 VS
Azure函数应用程序使用slf4j登录App Insights

使用 Spring Cloud Functions 实现了 Azure Function App 在应用程序设置 APPINSIGHTS INSTRUMENTATIONKEY 中配置的 App Insights 检测密钥我使用 lombo
react-native fetch - 请求正文 - 意外的 EOF

在我的反应本机应用程序中我尝试使用以下命令发出获取请求body 但是我收到错误消息unexpected EOF 实际上请求已发出我的意思是我可以通过后端日志看到请求已发送而在请求之后它立即显示错误消息这是我的fetch met
python: += s, 中的逗号有什么作用？

我正在做一个问题输入是字符串 abc bcd acef xyz az ba a z 代码如下所示 def groupStrings self strings groups collections defaultdict list for
如何获取res文件夹的Uri？

我正在尝试获取可绘制文件夹中图像的 Uri 我尝试了很多可能的方法但似乎没有任何效果谁能建议我如何获取 res 文件夹的 Uri 任何帮助深表感谢嗯实际上很容易包中资源的基本 URI 类似于以下可能性 android resour
如何为 iphone 5 设置 apple-touch-startup-image？

I tried 但这没有用苹果的界面指南还没有针对 iPhone 5 进行更新有谁知道吗谢谢 1 视口不要使用 width device width 使用以下代码
SSO - 未找到 OpenID 端点

我正在尝试让 SSO openid 与 dotnetopenauth 一起使用我有两个单独的项目分别进行调试都在本地主机上但有两个不同的端口一个充当提供者一个充当依赖方依赖方正在运行localhost 1903 提供者正在运行
无效的 Git RSA 密钥指纹

我开始收到这个错误 Received disconnect from 192 30 253 112 port 22 2 Connection blocked because server only allows public key aut
如何在 Visual Studio 或其他构建工具的一个 C# 项目中生成 dll 和 exe 的混合？

如何在 Visual Studio 或其他构建工具的一个 C 项目中生成 dll 和 exe 的混合技术上可行吗是的我知道它可以在 2 个或更多项目中完成我不确定你的问题的动机是什么因为你可以引用 Net 可执行文件就好像它是
从 MySQL 中的同一（随机）记录中选择 2 列的最快方法是什么？

我希望从同一条记录中随机检索一对列不过我听说 Rand 效率很低所以我想使用不同的方式很多文章都这么说包括http akinas com pages en blog mysql random row 是的我的标题几乎说明了一切
Haskell do 块中如何允许表达式

在以下代码的第 4 行中我在 do 块中的两个 IO 操作之间夹有一个表达式 1 doubleX Show x Num x gt x gt IO 2 doubleX x do
我需要从 tomcat 读取带有日志的远程文件

我需要从 tomcat 读取带有日志的远程文件如果我可以通过 ssh 访问日志文件夹最方便的方法是什么日志查看器可以从远程服务器读取日志它支持SFTP FTP和Samba 它还提供远程文件系统浏览器免责声明我是 OtrosLog
如何用swift 2.0播放背景音乐？

嗨我是 swift 和 ios 开发的新手我的代码一直在工作直到我更新到 Swift 2 0 我使用了 swift 迁移工具但我仍然不知道如何排序和修复我的代码请帮忙 import AVFoundation var backgro
如何列出项目中的所有表格大小

有没有办法列出 BigQuery 中的所有表大小我知道这样的命令 select table id sum size bytes pow 10 9 as size from certain dataset TABLES group by 1

如何列出项目中的所有表格大小

如何列出项目中的所有表格大小 的相关文章

随机推荐

热门标签

如何列出项目中的所有表格大小的相关文章