检查 Hive 表是否在给定列上分区

2023-12-15

我有一个配置单元表列表，其中一些是分区的。给定一列，我需要检查特定表是否在该列上分区。我搜索过并发现desc 格式的表名将产生表的所有详细信息。由于我必须迭代所有表并获取列表，因此 desc 格式没有帮助。有没有其他方法可以做到这一点。

您可以直接连接到元存储并查询它：

metastore=# select d."NAME" as DATABASE, 
  t."TBL_NAME" as TABLE, 
  p."PKEY_NAME" as PARTITION_KEY 
  from "PARTITION_KEYS" p 
  join "TBLS" t on p."TBL_ID"=t."TBL_ID" 
  join "DBS" d on t."DB_ID"=d."DB_ID";

 database |    table    | partition_key
----------+-------------+---------------
 default  | src_union_1 | ds
 default  | cbo_t1      | dt
 default  | cbo_t2      | dt

查询元存储的确切语法取决于您对元存储的特定选择（在我的例子中是 PostgreSQL 元存储）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

hive

HiveQL

检查 Hive 表是否在给定列上分区的相关文章

为 Presto 和 AWS S3 设置独立 Hive Metastore 服务

我工作的环境中使用 S3 服务作为数据湖但没有 AWS Athena 我正在尝试设置 Presto 以便能够查询 S3 中的数据并且我知道我需要通过 Hive Metastore 服务将数据结构定义为 Hive 表我正在 Docker
MiniDFSCluster UnsatisfiedLinkError org.apache.hadoop.io.nativeio.NativeIO$Windows.access0

做时 new MiniDFSCluster Builder config build 我得到这个异常 java lang UnsatisfiedLinkError org apache hadoop io nativeio NativeIO
hive sql查找最新记录

该表是 create table test id string name string age string modified string 像这样的数据 id name age modifed 1 a 10 2011 11 11 11 1
将 CSV 转换为序列文件

我有一个 CSV 文件我想将其转换为 SequenceFile 我最终将使用它来创建 NamedVectors 以在聚类作业中使用我一直在使用 seqdirectory 命令尝试创建 SequenceFile 然后使用 nv 选项将该输
非 hdfs 文件系统上的 hadoop/yarn 和任务并行化

我已经实例化了 Hadoop 2 4 1 集群并且发现运行 MapReduce 应用程序的并行化方式会有所不同具体取决于输入数据所在的文件系统类型使用 HDFS MapReduce 作业将生成足够的容器以最大限度地利用所有可用内存
如何创建 HIVE 表来读取分号分隔值

我想创建一个 HIVE 表该表将以分号分隔的值读取但我的代码不断给出错误有没有人有什么建议 CREATE TABLE test details Time STRING Vital STRING sID STRING PARTITION
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
InvalidRequestException（为什么：empid 如果包含 Equal，则不能被多个关系限制）

这是关于我从 Apache Spark 查询 Cassandra 时遇到的问题 Spark 的正常查询工作正常没有任何问题但是当我使用关键条件进行查询时出现以下错误最初我尝试查询复合键列族它也给出了与下面相同的问题由以下原因引
Spark SQL sql("").first().getDouble(0) 给我不一致的结果

我有下面的查询它应该找到列值的平均值并返回一个数字的结果 val avgVal hiveContext sql select round avg amount 4 from users payment where dt between 2
处理 oozie 工作流程中的循环

我有一个 oozie 用例用于检查输入数据可用性并根据数据可用性触发 MapReduce 作业所以我编写了一个 shell 脚本来检查输入数据并在 oozie 中为其创建了一个 ssh 操作输入数据检查的重试次数和重试间隔应该是可配
2n + 1 法定人数是什么意思？

我在描述 HBase 的 Zookeeper 配置时遇到过这个问题但我对这个术语并不熟悉 N 与我的 HBase 集群中的节点数量有关系吗或者我应该在 Zookeeper 集群中使用的节点数量 2f 1是指你所需要的可靠性可用性水平
Apache hadoop 版本 2.0 与 0.23

Hadoop 的版本和发行版太多让我很困惑我有几个问题 Apache Hadoop 1 x 是从 0 20 205 开始的 Apache Hadoop 2 0 是从 0 22 还是 0 23 开始根据这个blogpost http b
从 HDFS 传出文件

我想将文件从 HDFS 传输到另一台服务器的本地文件系统该服务器不在 hadoop 集群中而是在网络中我本可以这样做 hadoop fs copyToLocal
使用字符串数组在 Hive 表上加载 CSV 文件

我正在尝试将 CSV 文件插入 Hive 其中一个字段是 string 数组这是 CSV 文件 48 Snacks that Power Up Weight Loss Aidan B Prince Health Fitness Trave
java.io.IOException: EnsureRemaining: 仅剩余 0 个字节，尝试读取 1

我在 giraph 中的自定义类方面遇到一些问题我制作了 VertexInput 和 Output 格式但总是收到以下错误 java io IOException ensureRemaining Only bytes remaining
无法验证 serde：org.openx.data.jsonserde.jsonserde

我编写了这个查询来在配置单元上创建一个表我的数据最初是 json 格式所以我已经下载并构建了 serde 并添加了它运行所需的所有 jar 但我收到以下错误 FAILED Execution Error return code 1 fr
将 Spark 添加到 Oozie 共享库

默认情况下 Oozie 共享 lib 目录提供 Hive Pig 和 Map Reduce 的库如果我想在 Oozie 上运行 Spark 作业最好将 Spark lib jar 添加到 Oozie 的共享库而不是将它们复制到应用程序
公平调度器和容量调度器有什么区别？

我是 Hadoop 世界的新手想了解公平调度程序和容量调度程序之间的区别另外我们什么时候应该使用每一个请简单地回答一下因为我在网上读了很多东西但从中得到的不多公平调度是一种为作业分配资源的方法使得所有作业随着时间的推移平均获得
适用于 Python 3.x 的 Hive 客户端

是否可以使用 Python 3 x 连接到 hadoop 并运行 hive 查询我正在使用Python 3 4 1 我发现可以按照这里写的方式完成 https cwiki apache org confluence display Hiv
Python 包安装：pip 与 yum，还是两者一起安装？

我刚刚开始管理 Hadoop 集群我们使用 Bright Cluster Manager 直至操作系统级别 CentOS 7 1 然后使用 Ambari 以及适用于 Hadoop 的 Hortonworks HDP 2 3 我不断收到安装

随机推荐

每个程序员都应该阅读的最有影响力的书是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导 Locked 这个问题及其
根据一列聚合具有多列的数据框[重复]

这个问题在这里已经有答案了我想从许多列的数据框中进行聚合即sum 数百列由一列组成无需指定每个列名称一些示例数据 names lt floor runif 20 1 5 sample lt cbind names for i in
如何运行 sql 脚本以便从 java 代码更新 Derby 架构？

我们客户端的 derby 数据库安装有不同的架构版本例如 Customer1 的数据库架构版本为 4 1 5 0240 Customer2 的数据库架构版本为 4 0 1 0330 这个想法是在安装新软件时将这些架构更新为实际版本有几个
如何使 pandas HDFStore 的“放置”操作更快

我正在尝试使用 pandas hdf5 构建 ETL 工具包我的计划是从 mysql 中提取表到 DataFrame 将此 DataFrame 放入 HDFStore 中但是当我执行步骤 2 时我发现将数据帧放入 h5 文件会花费太
PHP无法读取cookie？

我喜欢用 PHP 来查看 cookiePHPSID27258STATUS与值一起存在COMPLETE如果是的话就做事在谷歌浏览器在选项中我可以看到这个cookie存在并且具有值COMPLETE 如果我运行这个 PHP 脚本我会得到
用按钮触摸移动？

是否可以使用touchesMoved用按钮代替功能UIImageViews Yes 在你的 h 文件中 IBOutlet UIButton aButton 在你的 m 文件中 void touchesMoved NSSet touches
如何禁用“始终在关联应用程序中打开这些类型的链接”Chrome 警报

在 Chrome 中执行 Protractor 测试时我收到类似于以下内容的警报我想接受它以便能够继续执行测试首先我尝试过browser switchTo alert accept 但没有成功然后我用谷歌搜索了一下找到了以下解决方
如果有延迟，用 BufferingTargetWrapper 包装的 NLog FileTarget 无法写入日志

我可能偶然发现了 NLog 的问题但我想我应该先在这里检查一下答案为了重现这个问题我克隆了 NLog 源这样我就可以添加延迟来导致问题在 Visual Studio 中打开后我添加了一个控制台应用程序该应用程序引用 NLog
使用 LDAP/Java 启用 Active Directory 用户

我正在尝试使用 LDAP 和 Java 1 4 在 Active Directory 中启用用户但是我不断收到以下错误 java lang NullPointerException 位于 com sun jndi ldap LdapCtx
FBSDKGraphRequest 响应问题 - 未获得分数

我正在使用以下代码来获取我的 Facebook 朋友的游戏得分 void GetFriendScore NSMutableDictionary params NSMutableDictionary dictionaryWithObjects
是什么导致我的 UI 在关闭串行端口时冻结？

我正在开发与串行端口相关的应用程序使用时DataReceived的事件SerialPort我需要用接收到的字节更新文本框 private void Connection DataReceived object sender SerialD
如何运行创建 Dataproc 集群、运行作业、从 Cloud Function 删除集群

我想启动 Dataproc 作业来响应到达 GCS 存储桶中的日志文件我也不想让持久集群保持运行因为新的日志文件每天只到达几次并且大多数时间都是空闲的此处提供了本教程的较新版本 https cloud google com data
当我从活动 2 返回到活动 1 后，MediaBrowser.subscribe 不起作用（6.0.1 Android）

当我打开活动 1 应用程序的主启动器活动时其中包括 MediaBrowser 连接 MediaBrowser subscribe工作正常 onChildrenLoaded在它之后被调用但是当我从活动 1 打开一些其他活动编号 2
查找完整注释的文件

在包含大量文件和项目的解决方案中如何找到所有完全注释的文件我假设每行代码都以 EDIT 或为空在此类文件中我使用的是VS 2008 C ReSharper可用我知道通常这样的文件不应该存在这就是源安全的用途要查找当前目录中及
是否可以有一个窗口来插入powershell制作的数据？

when I announce my changes on a server i always use my xml file which is pretty big and I search for the right place of
sbt 未解决的依赖关系 sbt_2.9.1;0.7.4 sbt_2.9.1;0.7.7:

我得到了像问题这样未解决的依赖关系here 获取 org scala tools sbt sbt 2 9 1 0 7 7 UNRESOLVED DEPENDENCIES org scala tools sbt sbt 2 9 1 0 7 7
为什么这不会打印任何整数？

try Scanner sc new Scanner new File testing txt while sc hasNextInt int i sc nextInt timing add i System out println i s
使用递归查找 Python 列表中的第 K 个最大元素

给定一个包含一些随机未排序数字的输入列表我试图编写一个程序来输出该列表中第 k 个最大的不同元素例如 Input el 10 10 20 30 40 40 k 2 Output 30 Since 30 is the second lar
SQL 搜索列，其中列中的一项是另一项的子字符串

有没有办法让sql语句搜索具有多个项目的列字符串是否包含某个项目但不包含作为子字符串的某个项目以下是我当前使用的sql语句 select from tbltest where platform like item platform 是字
检查 Hive 表是否在给定列上分区

我有一个配置单元表列表其中一些是分区的给定一列我需要检查特定表是否在该列上分区我搜索过并发现desc 格式的表名将产生表的所有详细信息由于我必须迭代所有表并获取列表因此 desc 格式没有帮助有没有其他方法可以做到这一点您可

检查 Hive 表是否在给定列上分区

检查 Hive 表是否在给定列上分区 的相关文章

随机推荐

热门标签

检查 Hive 表是否在给定列上分区的相关文章