我创建了一个分区的配置单元表。我将数据插入到该表中。现在假设我执行一个select *
查询使用where
那么我如何确保 Hive 查询正在使用分区?
假设您的 HIVE 数据分为 3 个分区,并且每个 HDFS 分区包含一个不大于 1 个 HDFS 块的文件,则分区值上带有 WHERE 的 SELECT * 应触发单个 YARN 映射器。
请注意,对于新的 HIVE 引擎(例如 TEZ 和 LLAP (Hortonworks) 或 Impala (Cloudera)),此行为可能有所不同
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)