从 Spark 作业中调用 JDBC 到 impala/hive 并创建表

2023-11-23

我正在尝试在 scala 中编写一个 Spark 作业，该作业将打开与 Impala 的 jdbc 连接，并让我创建一个表并执行其他操作。

我该怎么做呢？任何例子都会有很大的帮助。谢谢你！

val JDBCDriver = "com.cloudera.impala.jdbc41.Driver"
val ConnectionURL = "jdbc:impala://url.server.net:21050/default;auth=noSasl"

Class.forName(JDBCDriver).newInstance
val con = DriverManager.getConnection(ConnectionURL)
val stmt = con.createStatement()
val rs = stmt.executeQuery(query)

val resultSetList = Iterator.continually((rs.next(), rs)).takeWhile(_._1).map(r => {
    getRowFromResultSet(r._2) // (ResultSet) => (spark.sql.Row)
}).toList

sc.parallelize(resultSetList)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

JDBC

apachespark

impala

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表的相关文章

JDBC set_approle

我正在尝试使用prepareCall 通过 JDBC 连接设置应用程序角色它似乎工作正常即语法方面但 SQL Server 2008 返回此错误 Application roles can only be activated at t
SparkSession 初始化需要很长时间

SparkSession 初始化需要很长时间才能成功这是我的代码 import findspark findspark init import pyspark from pyspark sql import SparkSession sp
乔达时间：将 UTC 转换为本地时间

我想将 Joda Time UTC DateTime 对象转换为本地时间这是一种看似有效的费力方法但一定有更好的方法这是没有周围声明的代码在 Scala 中 val dtUTC new DateTime 2010 10 28T04
如何将列表插入数据库

我是 Java 新手我已经创建了产品类型的通用列表如何将其添加到数据库中该列表包含Products的对象数据库中的列是Products类的字段即使我通过 listvariable get 0 等分隔列表我也会得到对象而不是该对
在 Scala 中生成数字的质因数

如何在 Scala 中生成整数的因子这是我的看法1 def factorize x Int List Int def foo x Int a Int List Int if a gt Math pow x 0 5 return List
我在 Scala 中将资源放在哪里？

在学习使用 Scala 和 JavaFX 时我在 a 中遇到了以下代码ProScalaFX 示例 https github com jpsacha ProScalaFX val resource getClass getResource
副作用是纯函数中找不到的一切吗？

可以肯定地说以下二分法成立每个给定的函数是要么纯粹或有副作用如果是这样函数的副作用就是纯函数中找不到的任何东西这很大程度上取决于您选择的定义可以公平地说函数是pure or impure 纯函数始终返回相同的结果并且不会
有什么方法可以*不*在 Postgresql 中使用服务器端准备好的语句吗？

在比如说 Python 中我可以发出 psycopg2 connect cursor execute select from account where id 00100000006ONCrAAO 在服务器上会产生以下日志条目 2011
Scalaz 7 Iteratee 处理大型 zip 文件（OutOfMemoryError）

我正在尝试使用 scalaz iteratee 包在恒定空间中处理大型 zip 文件我需要对 zip 文件中的每个文件执行一个长时间运行的进程这些进程可以并且应该并行运行我创建了一个EnumeratorT使每个膨胀ZipEntry
Spark 2.1无法在CSV上写入Vector字段

当我将代码从 Spark 2 0 迁移到 2 1 时我偶然发现了与 Dataframe 保存相关的问题这是代码 import org apache spark sql types import org apache spark ml l
Scala 重载构造函数和 super

我无法理解如何在 Java 上开发类似于以下的 Scala 代码 public abstract class A protected A protected A int a public abstract class B protected
如何在 Akka Stream 中记录流量？

我有一个带有单个流图的 Akka Stream 应用程序我想测量源头的流量并每 5 秒记录一次例如在过去 5 秒内收到 3 条消息我尝试过 someOtherFlow groupedWithin Integer MAX VALUE
为 Spark Thrift 服务器提供仓库目录的路径

我已经设置了 Spark 集群并且成功通过 Spark SQL 连接器连接 Tableau 我从 Spark shell 创建了表并使用 saveAsTable 如何访问从 Tableau 保存的表启动spark thrift服务器时
将列表拆分为多个具有固定元素数量的列表

如何将元素列表拆分为最多包含 N 个项目的列表例如给定一个包含 7 个元素的列表创建 4 个组最后一组可能包含较少的元素 split List 1 2 3 4 5 6 seven 4 gt List List 1 2 3 4 Lis
Spark：用列的平均值替换数据框中的空值

如何创建 UDF 以编程方式将每列中 Spark 数据框中的空值替换为列平均值例如在示例中数据 col1 空值的值为 2 4 6 8 5 5 5 示例数据 col1 col2 col3 2 null 3 4 3 3 6 5 null
使用 Spark pandas_udf 创建列，具有动态数量的输入列

我有这个 df df spark createDataFrame row a 5 0 0 0 11 0 row b 3394 0 0 0 4543 0 row c 136111 0 0 0 219255 0 row d 0 0 0 0 0
Scala 组合器解析器 - 区分数字字符串和变量字符串

我正在做 Cay Horstmann 的组合器解析器练习我想知道区分代表数字的字符串和代表匹配语句中变量的字符串的最佳方法 def factor Parser ExprTree wholeNumber expr ident case a
IntelliJ IDEA Scala 插件问题

我对新的 Intellij IDEA 10 和 Scala 插件有疑问当我在 Scala 源文件中输入任何内容时编辑器会永久冻结在其他文件 java 和其他编辑器中效果很好结构视图 scala 检查和显示成员功能已关闭堆大小增加
Scala：在运行时获取 mixin 接口

我需要在运行时从给定的类获取所有接口全部加载在类加载器中例如如果一个类是这样声明的 trait B trait C trait D class A extends B with C with D 我想在运行时获取这些信息 A 取决于
Sparklyr - 在 Apache Spark Join 中包含空值

问题在 Apache Spark Join 中包含空值 https stackoverflow com questions 41728762 including null values in an apache spark join有 Sc

随机推荐

你能让 TS 从被赋值的值中推断出变量的泛型类型参数吗？

正在接听这个问题解决方案是指定类型参数Map构造函数像这样 const conditions3 ReadonlyMap
JNI 可以支持类路径中的通配符扩展吗？

我有一个通过 JNI 调用 Java 的 C 二进制文件我将 CLASSPATH 设置为 somedir 以获取 somedir 中的所有 jar 当我运行二进制文件时找不到所需的类定义当我跑步时 java that class s
如何找到 int[] 的大小？ [复制]

这个问题在这里已经有答案了 I have int list 1 2 3 如何获得尺寸list 我知道对于 char 数组我们可以使用strlen array 查找尺寸或检查 0 在数组的末尾 I tried sizeof array s
了解 Spark 序列化

在 Spark 中我们如何知道哪些对象在 driver 上实例化哪些对象在 executor 上实例化以及如何确定哪些类需要实现 Serialized 序列化对象意味着将其状态转换为字节流以便字节流可以恢复为对象的副本如果 Jav
何时使用 sys.path.append 以及何时修改 %PYTHONPATH% 就足够了

所以事实证明我在 PYTHONPATH 定义中缺少一个分号但这只让我到目前为止由于某种原因我的脚本无法作为计划任务在 WinXP 上运行直到我明确地将 PYTHONPATH 中的目录添加到脚本顶部问题是我什么时候需要显式地
角度错误：如果在表单标签内使用 ngModel，则必须设置 name 属性或 [duplicate]

这个问题在这里已经有答案了关于该错误还有很多类似的问题和答案如果 ngModel 在表单标签内使用则必须设置 name 属性或者必须在 ngModelOptions 中将表单控件定义为独立解决方案是定义name消息中描述的属性
不同移动设备中的加速度计和陀螺仪精度

我想使用移动设备的传感器加速度计指南针陀螺仪这个问题已经在几个地方讨论过例如 here and here 第一步是确定哪个平台最适合实施此类系统主要的可能性是三星的 Galaxy Galaxy tab 或 iphone ipad
开放式 Java SMB 服务器实现

Java 中是否有 SMB CIFS 服务器的开放实现我能找到的唯一实现是 Alfresco 但它不是开源的一个相关的问题假设没有这样的实现我很惊讶没有一个库提供 SMB 的子集例如用于简单的文件传输我的直觉是实现一个简单的服
C/C++ 严格别名、对象生命周期和现代编译器

我对 C 严格别名规则及其可能的含义感到困惑考虑以下代码 int main int32 t a 5 float f float a f 1 0f int32 t b a Probably not well defined float g
通过自动更改所有函数和变量名称来模糊生产中的反应代码

是否有任何库可以帮助模糊生产的反应构建就像是 const MyComp gt const propa propb useMyfunc return to const xyz gt const yxz zyx zzz return 正确的选
IntelliJ（使用 gradle）：即使已安装也找不到 Kotlin 插件

我正在尝试使用 gradle 构建我的项目但似乎找不到我的 kotlin 插件即使我确实使用从磁盘安装插件添加了它这是我收到的错误无法解析配置 classpath 的所有依赖项找不到 org jetbrains kotlin
将常量值从 _layout.cshtml 传递给 Angular

好的我在 ASP Net SPA 项目的 Layout cshtml 中有一个常量变量我将传递它们以便 Angular 可以访问它们我怎样才能做到这一点例如这是我试图传递的一个值 var lenderValues Html Ac
如何使用phonegap在iOS应用程序中打开网页？

我只想在我的 iOS PhoneGap 应用程序中只有一个视图该视图将是一个网页我怎样才能用特定的网址加载这个唯一的视图我想你是通过 javascript 来做到这一点的如果是的话怎么做我不是 html javascript 脚
ASP.Net 中的数据缓存

我需要从一些参考数据中填充一些下拉框即城市列表国家列表等我需要将其填写在各种网络表格中我认为我们应该在应用程序中缓存这些数据这样我们就不会在每个表单上都访问数据库我是缓存和 ASP Net 的新手请建议我如何做到这一点我总
查找窗口失败 - 2 个 Galaxy Nexus 上同一应用程序的不同行为

我有两部 Galaxy Nexus 手机这些手机具有相同的固件版本 4 0 2 相同的内部版本号相同的内核版本当我使用 Eclipse 将同一个应用程序部署到两部手机时我看到每部手机都有不同的行为在一部手机上一切都按预期进行在
WCF InvalidOperationException：绑定实例已与侦听 URI 关联

我是 WCF 的初学者正在学习 Essential WCF 我在使用 ServiceContract NameSpace 和 Name 时遇到问题当我运行代码时我捕获了以下 InvalidOperationException 但我无法
jQuery的val()方法改变似乎并没有改变DOM

Doing someId val newValue 不改变 DOM 我可以检索这个值 someId val 但是 DOM 中的元素仍然没有 value 属性如何设置输入组件的值并更改 DOM 我在用着jQuery 1 5 1 val do
在 R dplyr 中按计数扩展列

我有一个因子列我想将每个因素分散到一列中然后通过每个 id 出现的该因素的计数来填补空白假设我们有 car lt c a b b b c c a b b b c c type lt c good regular bad good re
适合从扫描条形码 iPhone 应用程序获取产品详细信息的 api？

正在开发示例条形码扫描仪应用程序我使用 ZBar API 扫描产品中的条形码它工作得很好现在希望获得扫描条形码的产品我想从 api 获取产品的以下详细信息 Product Name Product Price Selling fe
从 Spark 作业中调用 JDBC 到 impala/hive 并创建表

我正在尝试在 scala 中编写一个 Spark 作业该作业将打开与 Impala 的 jdbc 连接并让我创建一个表并执行其他操作我该怎么做呢任何例子都会有很大的帮助谢谢你 val JDBCDriver com cloudera

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表 的相关文章

随机推荐

热门标签

从 Spark 作业中调用 JDBC 到 impala/hive 并创建表的相关文章