为什么谓词下推不起作用？

2024-03-09

程序草图

我创建一个 HiveContexthiveContext.
有了这个背景，我创建了一个 DataFramedf来自 JDBC 关系表。
我注册数据框df via df.registerTempTable("TESTTABLE").
我通过启动 HiveThriftServer2HiveThriftServer2.startWithContext(hiveContext).

测试表包含 1,000,000 个条目，列是 ID (INT) 和 NAME (VARCHAR)

+-----+--------+
| ID  |  NAME  |
+-----+--------+
| 1   | Hello  |
| 2   | Hello  |
| 3   | Hello  |
| ... | ...    |

我使用 Beeline 访问 HiveThriftServer 的 SQL 端点（端口 10000）并执行查询。例如。

SELECT * FROM TESTTABLE WHERE ID='3'

当我检查数据库的查询日志以及执行的 SQL 语句时，我看到

/*SQL #:1000000 t:657*/  SELECT \"ID\",\"NAME\" FROM test;

因此，由于缺少 where 子句，因此不会发生谓词下推。

问题

这引发了以下问题：

为什么不执行谓词下推？
不使用registerTempTable 可以改变这一点吗？
如果是这样，怎么办？或者这是 Hive ThriftServer 的已知限制？

反例

如果我创建一个 DataFramedf在 Spark SQLContext 中并调用

df.filter( df("ID") === 3).show()

我观察到

/*SQL #:1*/SELECT \"ID\",\"NAME\" FROM test WHERE ID = 3;

正如预期的那样。

现在回答可能已经太晚了。在这种情况下，这不起作用，因为 ID 被定义为 Int 并且在原始查询中您传递了一个字符串 ('3')。谓词下推也会查找相同的列名和类型。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

predicate

apachesparksql

为什么谓词下推不起作用？的相关文章

Scala 中的类型类解析如何工作？

我有一个带有类型参数的函数我想知道该类型参数是否是一个Option或不我读过一些博文即this one http danielwestheide com blog 2013 02 06 the neophytes guide to s
Play 框架 2.0：在 Http.Context 中存储值

我正在尝试在 Play 框架中的 scalaquery 中实现基于请求的会话我使用 scalaquery 创建一个会话并尝试将其存储在当前的 http 上下文中如下所示 def withTransaction A bp BodyP
Scala 方法和高级类型参数

我试图在 scala 中定义一个方法它采用通用类型S lt Seq Double 并返回一个 S FixedLoad FixedLoad 是一个具体类型但我的实现给了我错误我不明白为什么尽管我多次尝试去理解参数类型和高级类型但我的
获取 emr-ddb-hadoop.jar 将 DynamoDB 与 EMR Spark 连接

我有一个 DynamoDB 表需要将其连接到 EMR Spark SQL 才能对该表运行查询我获得了带有发行标签 emr 4 6 0 和 Spark 1 6 1 的 EMR Spark Cluster 我指的是文档使用 Spark 分
在 case 语句中间使用 unapply 的对象

scala gt object Test def unapply L R v L R Some v defined object Test scala gt 1 2 match case 1 Test 2 gt println First
运行 JAR 时“JCE 无法验证提供者 BC”

在我的 scala 项目中我使用 org bouncycastle bcprov jdk14 1 51 用于密码学如果它在 Scala IDE 中测试我的项目它工作得很好但是一旦我制作了一个 JAR 并尝试通过以下方式运行它java
演员邮箱溢出。斯卡拉

我目前正在与 scala 的两位演员合作一 producer 产生一些数据并将其发送到parcer 生产者发送一个HashMap String HashMap Object List Int 通过消息以及this标记发件人 parcer
Scala SBT 和 JNI 库

我正在编写一个简单的应用程序Scala通过以下方式使用 leveldb 数据库leveldbjni图书馆我的build sbt文件看起来像这样 name Whatever version 1 0 scalaVersion 2 10 2 l
Scala：获取 Map.head 元素的键（和值）

让我们想象一下以下不可变的 Map val foo Map 10 ten 100 one hundred 我想获得第一个元素的密钥 foo head获取第一个元素但接下来呢我还想要这个元素的值即十设置键值对 val key va
从 pandas udf 记录

我正在尝试从 python 转换中调用的 pandas udf 进行日志记录因为在执行器上调用的代码不会显示在驱动程序的日志中我一直在寻找一些选项但到目前为止最接近的选项是这个one https stackoverflow com q
什么是 Java 8“视图”？

我正在观看 Paul Philips 的演讲 http www youtube com watch v TS1lpKBMkgg http www youtube com watch v TS1lpKBMkgg 在 12 48 比较 Scal
如何从 Databricks Delta 表中删除列？

我最近开始发现 Databricks 并遇到了需要删除增量表的特定列的情况当我使用 PostgreSQL 时它就像 ALTER TABLE main metrics table DROP COLUMN metric 1 我正在浏览 Da
如何解决创建 SwiftData #Predicate 的编译器错误？

我一直在尝试很多方法来解决这个问题我正在尝试使用谓词获取 SwiftData 记录但我尝试的一切都会导致两个错误初始化程序 init 要求 Item 符合 Encodable 初始化程序 init 要求 Item 符合 Decodab
如何在 Scala 中编写 Pig UDF

我正在尝试在 Scala 中编写 Pig UDF 使用 Eclipse 我已将 pig jar 添加为 java 构建路径中的库这似乎解决了以下 2 个导入问题导入 org apache pig EvalFunc 导入 org apac
Joda Time 类没有任何构造函数...为什么？我做错了什么？

显然 Eclipse 上的 Scala 试图让我相信DateTime Period DateMidnightJoda Time 中的许多其他类没有任何构造函数考虑到它们的文档显示了构造函数和许多方法这很奇怪我唯一可以访问的是静态方法
如何从spark管道逻辑模型中提取变量权重？

我目前正在尝试学习 Spark Pipeline Spark 1 6 0 我将数据集训练和测试导入为 oas sql DataFrame 对象执行以下代码后生成的模型是oas ml tuning CrossValidatorMode
在scala / play框架中构建Json文件

我正在使用 Play 框架和 Scala 我需要提供一个如下所示的输入 id node37 name 3 7 data children 如何使用 json 获取该格式以下是 Play 框架网站上的示例 val JsonObject Js
清理 IntelliJ 中构建的 Play 框架

我有一个拼写错误conf routes文件导致 Play Framework 生成错误命名的类重建项目并运行Invalidate Caches并没有解决 IntelliJ 中的问题当我手动运行时重新生成了不正确的类文件play clea
如何将模型从 ML Pipeline 保存到 S3 或 HDFS？

我正在尝试保存 ML Pipeline 生成的数千个模型正如答案中所示here https stackoverflow com questions 32121046 run 3000 random forest models by gro
如何通过sparkSession向worker提交多个jar？

我使用的是火花2 2 0 下面是我在 Spark 上使用的 java 代码片段 SparkSession spark SparkSession builder appName MySQL Connection master spark ip

随机推荐

如何限制 Phusion Passenger 内存使用？

有没有办法限制 Phusion Passenger 在提供您的应用程序时使用的内存量在我获得大量流量后我的主机过来并终止了该进程因此我最终提供了空白页面我能做些什么来表达嘿不要使用超过 100Mb 的内存并且无论网站有多超载
在 Rails 中的多个数据库之间切换而不破坏事务

我正在设置一个包含多个数据库的 Rails 应用程序它用ActiveRecord Base establish connection db config在数据库之间切换所有数据库都在database yml中配置 establish c
Arrays.stream().map().sum() 性能不稳定

我偶然发现了一个对原始数组进行非常简单的映射归约操作的性能曲线极其不稳定的实例这是我的 jmh 基准代码 OutputTimeUnit TimeUnit NANOSECONDS BenchmarkMode Mode AverageTim
如何在按钮单击时显示文本区域？
使用python删除html标签？

我知道可能有一百万个问题但我想知道如何删除这些标签而无需导入或使用 HTMLParser 或正则表达式我尝试了一堆不同的替换语句来尝试删除包含的部分字符串但无济于事基本上我正在处理的是 response urlopen url
动态添加ImageView到View

我正在制作一个使用 View 类的 Android 游戏但我没有使用 XML 布局我所有的图像都是用画布绘制的现在我的问题是我无法使用位图我正在尝试将 ImageView 动态添加到我的 View 类中以使用可触摸事件为什么是动
反应“捕获”事件处理程序是否总是在本机非捕获处理程序之前触发？

In 这个讨论线程 https discuss reactjs org t ordering of native and react events 829 2 苏菲阿尔珀特 https stackoverflow com users 49
OAuthException (#368) 尝试的操作已被视为滥用或被禁止

我正在尝试使用 Graph API 在我的墙上或我的一些朋友的墙上发布提要我授予了该应用程序所需的所有权限当我从页面发出请求时允许它们我拥有有效的访问令牌但即使发生此异常并且没有发布提要我的帖子请求看起来不错已授予权限我需要做
如何在 jQuery 中选择从当前元素开始的下一个“n”元素？

如何选择从当前元素开始的下一个 n 元素我的意思是 this attr 我想做 n 次以n 4为例 this attr this next attr this next next attr this next next next att
回流类型密封时的满射性检查

当密封类型上的模式匹配不详尽时 Scala 会发出警告但是当返回类型被密封时我们是否可以检查函数是否返回所有情况例如考虑以下 ADT sealed trait Foo case object Bar extends Foo case
捆绑包标识符 iOS 配置门户

我是 iOS 企业计划的团队代理我正在尝试添加一个新的应用程序 ID 新的应用程序 ID 以前从未在我的帐户中使用过但可能已被另一个企业帐户使用但是提交后它说 The bundle identifier you have spec
通过 Django 管理站点添加数据时更改大小写（大写/小写）

我正在配置我的新项目的管理站点我有点怀疑我应该怎么做通过管理站点添加数据时点击保存所有内容都转换为大写编辑好的我知道 upper 属性并且我做了一个视图我知道该怎么做但我想知道管理站点上是否有任何可用于字段配置的属性 P
针对 Windows Phone 7 Internet Explorer 9 的条件注释

Problem 条件注释例如 p All other browsers p 不工作在 Windows Phone 7 上或者至少不是我的 Question 有谁知道如何使用这些评论并且有测试了他们前 WP7 上的 IE 9 是否支持
Java Socket 编程不适用于 10,000 个客户端

我可以创建多个线程来支持套接字编程中的多客户端功能工作正常但如果有 10 000 个客户端想要连接我的服务器就无法创建这么多线程如何管理线程以便我可以同时监听所有这些客户端另外如果在这种情况下服务器想要向特定客户端发送某些内容
是否可以使用 .NET Remoting + TLS 1.2（或 1.1）？

最近我们的 PCI DSS 扫描失败并要求我们禁用 TLS 1 0 并启用 TLS 1 1 或 1 2 我在 Windows Server 2008 R2 盒子上找到了如何执行此操作的说明但我们有一个使用 NET 远程处理的旧应用程序
ActiveSupport::Memoizes 指的是哪种 Ruby memoize 模式？

因此在 Rails 3 2 中 ActiveSupport Memoizes 已被弃用消息内容如下 DEPRECATION WARNING ActiveSupport Memoizable is deprecated and will b
如何使用 Python OpenCV 优化圆检测？

我看过几页关于在 python 中使用 opencv 优化圆检测的页面所有这些似乎都针对特定图片的具体情况 cv2 HoughCircles 的每个参数的起点是什么由于我不确定推荐值是什么因此我尝试循环范围但这并没有产生任何有希望的
我如何在 ubuntu 中将 PDT 与 eclipse 关联/使用？

我想使用 PDT 和 eclipse 来调试 PHP 我使用的是ubuntu 9 04 谁能帮我如果可能请提供详细信息考虑到这个线程 http dev eclipse org mhonarc lists pdt dev msg0044
AngularJS - 可拖动和多个连接的可排序（jQuery UI + Angular-Common）

我正在尝试延长角度共同 https github com michaeljcalkins angular common非常好拖放模块 https github com michaeljcalkins angular common blob
为什么谓词下推不起作用？

程序草图我创建一个 HiveContexthiveContext 有了这个背景我创建了一个 DataFramedf来自 JDBC 关系表我注册数据框df via df registerTempTable TESTTABLE 我通过启动

为什么谓词下推不起作用？

程序草图

问题

反例

为什么谓词下推不起作用？ 的相关文章

随机推荐

热门标签

为什么谓词下推不起作用？的相关文章