Spark查询执行时间

2024-01-12

我安装了本地 hadoop 单节点和 hive，并且在 hdfs 中存储了一些 hive 表。然后我使用 MySQL Metastore 配置 Hive。现在我安装了 Spark，并且对 Hive 表进行了一些查询，如下所示（在 scala 中）：

var hiveContext = new org.apache.spark.sql.hive.HiveContext(sc)
result = hiveContext.sql("SELECT * FROM USERS");
result.show

你知道如何配置spark来显示查询的执行时间吗？因为默认情况下它不显示..

Use spark.time().

var hiveContext = new org.apache.spark.sql.hive.HiveContext(sc) result = hiveContext.sql("SELECT * FROM USERS"); spark.time(result.show)

https://db-blog.web.cern.ch/blog/luca-canali/2017-03-measuring-apache-spark-workload-metrics-performance-troubleshooting https://db-blog.web.cern.ch/blog/luca-canali/2017-03-measuring-apache-spark-workload-metrics-performance-troubleshooting

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Spark查询执行时间的相关文章

在 Spark MLlib 上使用 Java 中的 Breeze

在尝试从Java使用MLlib时使用微风矩阵运算的正确方法是什么例如scala 中的乘法很简单 matrix vector 相应的功能在Java中是如何表达的有一些方法例如 colon times 可以通过正确的方式调用 breez
如何在映射中将字符串转换为 Seq[String]

我有一个Map String String 以及需要的第三方功能Map String Seq String 有没有一种简单的方法来转换它以便我可以将地图传递给函数 original mapValues Seq 注意mapValues返回地
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
在 Scala 中将元素追加到列表末尾

我无法添加 type 元素T到一个列表中List T 我尝试过myList myElement但它似乎创建了一个奇怪的对象并访问myList last始终返回放入列表中的第一个元素我怎么解决这个问题 List 1 2 3 4 Result
Spark DataFrame 序列化为无效 json

TL DR 当我倾倒 Spark 时DataFrame作为 json 我总是得到类似的结果 key1 v11 key2 v21 key1 v12 key2 v22 key1 v13 key2 v23 这是无效的 json 我可以手动编辑转储
Java 8 Stream，获取头部和尾部

Java 8 引入了Stream http download java net jdk8 docs api java util stream Stream html类似于 Scala 的类Stream http www scala lang
如何在 scala repl 和 sbt 控制台中关闭/打开 typer 阶段

是否可以在不退出当前会话的情况下切换阶段我尝试进入 power 模式但它仍然不打印类型在SBT中只需添加以下设置 set scalacOptions in Compile console Xprint typer 在 REPL 中你可
为什么自类型类可以声明类

我知道 Scala 只能混合特征这对于依赖注入和蛋糕模式是有意义的我的问题是为什么我仍然可以声明一个需要另一个类但不需要特征的类 Code class C class D self C gt 这仍然编译成功我认为它应该编译失败因
在 Spark 结构化流 2.3.0 中连接两个流时，左外连接不发出空值

两个流上的左外连接不发出空输出它只是等待记录添加到另一个流中使用套接字流来测试这一点在我们的例子中我们想要发出具有 null 值的记录这些记录与 id 不匹配或且不属于时间范围条件水印和间隔的详细信息如下 val ds1Map
如何执行仅匹配正则表达式的测试？

在 sbt 0 10 1 中我经常使用test only缩小我的测试数量 sbt gt test only com example MySpec 但是我想缩小范围以便只运行名称描述与正则表达式匹配的测试是否有一些语法可以实现这样的
获取SettingKey[T]的值

我正在开发一个用于文档生成的插件我想将所有生成的文件输出到我选择的目录中该目录可以是SBT的子目录target目录如下 val newTargetDirectory SettingKey File document target di
根据 pyspark 中的条件从数据框中删除行

我有一个包含两列的数据框 col1 col2 22 12 2 1 2 1 5 52 1 2 62 9 77 33 3 我想创建一个新的数据框它只需要行 col1 的值 gt col2 的值就像注释一样col1 很长类型和col2 有双
Spark.sql.shuffle.partitions 的最佳值应该是多少，或者在使用 Spark SQL 时如何增加分区？

我实际上正在使用 Spark SQLhiveContext sql 它使用 group by 查询我遇到了 OOM 问题所以考虑增加价值spark sql shuffle partitions从默认的 200 到 1000 但这没有帮助
如何使用scala获取elasticsearch中_delete_by_query api的状态

我正在 scala 中向 elasticsearch 发送 HTTP post Http s http elkIp 5051 indexName delete by query postData s query terms zip id k
如何根据条件添加新列（而不面临 JaninoRuntimeException 或 OutOfMemoryError）？

尝试根据这样的条件创建具有多个附加列的 Spark 数据框 df withColumn name1 someCondition1 withColumn name2 someCondition2 withColumn name3 someCo
使用 Shapeless 记录组合任意数量的状态更改函数

我正在尝试移植combineReducers从 Redux 到 Scala 这个想法是每个函数控制它的一小部分状态并且combineReducers创建一个控制整个状态的函数我无法找出应该像这样工作的函数所需的签名 sealed trai
Java 拥有闭包后 Scala 的优势 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案随着 Java 中添加了闭包作为语言选择 Scala 相对于 Java 的优势是什么有人可以详细说明一下有什么优点吗除了闭包 J
Scala 和 Python 的通行证

我想知道是否有相当于 python 的 pass 表达式这个想法是编写没有实现的方法签名并编译它们只是为了对某些库原型的这些签名进行类型检查我能够使用以下方法模拟这种行为 def pass A A throw new Excepti
如何关闭 Scala 中因方法重载而导致代码无法编译的特定隐式？

我正忙着尝试自己回答这个问题 Scala Play 2 4 x 通过 anorm MySQL 处理扩展字符到 Java Mail https stackoverflow com questions 31417718 scala play 2
如何在不从 DataFrame 转换并访问它的情况下向数据集添加列？

我知道使用以下方法将新列添加到 Spark 数据集的方法 withColumn and a UDF 它返回一个 DataFrame 我还知道我们可以将生成的 DataFrame 转换为 DataSet 我的问题是如果我们仍然遵循传统的

随机推荐

如何用C#模拟浏览器HTTP POST请求并捕获结果

假设我们有一个带有搜索输入表单的网页它通过 HTTP GET 将数据提交到服务器这意味着服务器通过查询字符串接收搜索数据用户可以看到 URL 也可以自己初始化此请求通过 URL 查询字符串我们都知道这是问题所在如果这个网页通过
Javascript：显示带有复选框值的图像

我目前正在使用单选按钮和复选框来在 javascript 的帮助下显示图像具体来说我在处理复选框和显示图像时遇到问题使用单选按钮时只会显示该类别的一张图像但对于复选框需要显示多个图像例如用户可以检查夹克和手套的字段并且将显
如何在node.js中使用CasperJS？

我想在node js 中使用CasperJS 我参考了以下 URL 在 node js 中使用 CasperJS https github com sgentle phantomjs node https github com sgentl
Angular Js：类属性指令中的 onchange 不起作用

控制指令 js function validVehicleyear scope http return restrict C scope ngModel link function scope element attrs ngModel e
在 Docker 中启动并填充 Postgres 容器

我有一个包含 Postgres 数据库的 Docker 容器这是用官方的Postgres 图像 https registry hub docker com postgres 其中有一个 CMD 条目在主线程上启动服务器我想通过运行来填充
xcode 8 错误被服务委托拒绝 (SBMainWorkspace)

尝试在模拟器上运行构建我收到此错误打开 com companyname appname 的请求失败请求被服务委托 SBMainWorkspace 拒绝原因安全权利启动需要 com apple frontboard debuga
如何传递通用方法的 lambda 表达式参数以检查 MVC EF 4.0 中的重复项

我的应用程序中有超过 10 个设置屏幕在每个数据中我都必须检查重复数据例如这是一个示例代码 private void CheckDuplication AIRLINE airline var AIRLINE context AIRL
React Native 不会填满 iPad 上的窗口

我正在运行的任何 React Native 项目包括 Facebook 的示例在 iPad 上看起来都很奇怪它没有填满屏幕一切看起来太大内容左右各有2个黑条任何帮助都会很棒谢谢解决方案在 xcode 项目中转到常规选项
使用javascript获取具有多个下拉菜单的选项的选定值

我有多个功能其中有多个选项在选择某个选项时需要更新这些选项我还需要通过属性元素传递第三条数据 getElementById 适用于单个下拉菜单但是当页面上有多个菜单时如何使其工作我努力了var e document getElem
jQuery stop(true, true) 跳转到队列中所有动画的末尾

我一直在使用 jQuerystop true true 方法清除正在运行的动画以便下一个立即开始我注意到第一个参数 clearQueue 清除整个动画队列但第二个参数 jumpToEnd 仅跳转到当前正在运行的动画的末尾而不是从队列
如何静音AVPlayer中播放的视频？

我正在 AVPlayer 中播放视频现在我需要在播放时单独静音音频请建议如何在 Objective C 中进行操作谢谢苏雷什从iOS7开始你可以设置AVPlayerisMuted财产给true 在 Objective C 中该属
在 Entity Framework 4.1 Code First 中排除列可更新

有谁知道我们是否可以在 Entity Framework 4 1 Code First 中排除列的更新例如我有 CreatedOn 字段我不想在进行编辑更新时包含该字段这是否可能即有选择地从 EF Code First 4 1
Java Swing：GUI 未更新某些属性

编辑下面是一个最简单最简单且可检查的问题 RESUME 我正在做一个拉丁方应用程序它设置一个大小为 s 的正方形并且您需要使用一些限制来为其着色例如同一行或同一列中的颜色不同但我的麻烦不是问题本身而是Swing 我正在尝试使用
求矩阵中不同行和列的元素总和的最大值

我有一个 nxm 矩阵我需要找到不同行和列中其值之和的最大值例如考虑以下矩阵 m1 m2 m3 n1 1 2 3 n2 4 5 6 n3 7 8 9 n4 10 11 12 最大值为 12 8 4 24 请注意查找最大值并消除属于该列
检查断言是否启用

您可以启用禁用assert on the ClassLoader http docs oracle com cd E19683 01 806 7930 assert 5 index html 但如何确定它们是否已启用我想采用一些代码路径
避免Python中的对象别名？

我正在尝试编写一个函数来检查列表是否已排序返回True or False 如何避免多个变量指向同一事物 def is sorted t a t a sort 当我这样做时它会对两者进行排序a and t 我怎样才能避免这种情况这是 O
使用电子构建器的构建后脚本

在使用电子构建器打包安装程序之前是否可以在构建后运行某种脚本我需要生成一个应该分发的额外文件但我需要二进制文件 exe 来生成它 None
从外部模块添加 argparse 参数

我正在尝试编写一个可以由第三方扩展的Python程序该程序将从命令行运行并提供任何参数为了允许第三方创建自己的模块我创建了以下简化的基类 class MyBaseClass object def init self self d
哪个正则表达式适用于数字和字符串？

我正在尝试创建简单的 IDE 并根据以下内容为我的 JTextPane 着色字符串注释和关键字公共 int 数字整数如 69 浮点数如 1 5 我为源代码着色的方式是覆盖 StyledDocument 中的 insertSt
Spark查询执行时间

我安装了本地 hadoop 单节点和 hive 并且在 hdfs 中存储了一些 hive 表然后我使用 MySQL Metastore 配置 Hive 现在我安装了 Spark 并且对 Hive 表进行了一些查询如下所示在 scala

Spark查询执行时间

Spark查询执行时间 的相关文章

随机推荐

热门标签

Spark查询执行时间的相关文章