SparkContext、JavaSparkContext、SQLContext 和 SparkSession 之间的区别？

2024-03-01

有什么区别SparkContext, JavaSparkContext, SQLContext and SparkSession?
是否有任何方法可以使用 a 来转换或创建上下文SparkSession?
我可以使用一个条目完全替换所有上下文吗SparkSession?
所有功能都在SQLContext, SparkContext, and JavaSparkContext也在SparkSession?
一些函数如parallelize有不同的行为SparkContext and JavaSparkContext。他们的行为如何SparkSession?
我如何使用 a 创建以下内容SparkSession?
- RDD
- JavaRDD
- JavaPairRDD
- Dataset

有没有一种方法可以改变JavaPairRDD into a Dataset or a Dataset into a JavaPairRDD?

sparkContext是 Scala 实现入口点并且JavaSparkContext是一个java包装器sparkContext.

SQLContext是 SparkSQL 的入口点，可以从sparkContext在2.x.x之前，RDD、DataFrame和Data-set是三种不同的数据抽象。从Spark 2.x.x开始，这三种数据抽象是统一的SparkSession是Spark的统一入口点。

附加说明是，RDD 适用于非结构化数据、强类型数据，而 DataFrame 适用于结构化和松散类型数据。你可以check https://stackoverflow.com/questions/31508083/difference-between-dataframe-and-rdd-in-spark

有没有任何方法可以使用 Sparksession 转换或创建 Context ？

是的。它是sparkSession.sparkContext()对于 SQL，sparkSession.sqlContext()

我可以使用单个条目 SparkSession 完全替换所有 Context 吗？

是的。你可以从sparkSession中获取相应的上下文。

SQLContext、SparkContext、JavaSparkContext等中的所有函数是否都添加到SparkSession中？

不直接。你必须获得各自的上下文并利用它。诸如向后兼容性之类的东西

如何在SparkSession中使用这样的功能？

获取各自的上下文并利用它。

如何使用 SparkSession 创建以下内容？

RDD 可以从以下位置创建sparkSession.sparkContext.parallelize(???)
JavaRDD 与此相同，但在 java 实现中
Java对RDDsparkSession.sparkContext.parallelize(???).map(//making your data as key-value pair here is one way)
如果是结构化数据，sparkSession返回的Dataset就是Dataset。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

scala

apachespark

RDD

apachesparkdataset

SparkContext、JavaSparkContext、SQLContext 和 SparkSession 之间的区别？的相关文章

CDI 对象无法使用注入的构造函数进行代理

当尝试将参数注入 CDI bean ApplicationScoped 的构造函数时我遇到以下问题 Caused by org jboss weld exceptions UnproxyableResolutionException WE
Scala：“递归值...需要类型”，但我只使用 Java 类型

object Rec extends App val outStream new java io ByteArrayOutputStream val out new java io PrintStream new java io Buffe
如何在Eclipse中制作war文件[重复]

这个问题在这里已经有答案了制作war文件的简单方法是什么当我右键单击在服务器上运行时我的项目正在运行但我想部署在 tomcat 服务器上我已经安装了m2clipse但这给了我一个错误 maven是否必须制作war文件我需要特
如何使用 Java2D 创建硬件加速图像？

我正在尝试创建一个快速图像生成器它可以执行大量 2d 转换和形状渲染因此我尝试使用 BufferedImage 然后获取 Graphics2D 对象来执行所有绘图我现在主要关心的是 make 速度非常快所以我创建一个像这样的 Buf
是否有适用于 Java 的 Harel Statechart DSL 工具？

我正在寻找一种能够理解 DSL 的工具在其中我可以定义生成 Java 代码的状态图或者 DSL 中的状态图可以按原样运行该工具最好用 Java 编写并且必须根据 Harel 状态图或等效的 UML 2 状态机的定义支持超级状态和
对 Java Servlet 进行单元测试

我想知道对 servlet 进行单元测试的最佳方法是什么只要内部方法不引用 servlet 上下文测试内部方法就不是问题但是测试 doGet doPost 方法以及引用上下文或使用会话参数的内部方法呢有没有办法简单地使用经典工具例
无法解析 ListView 适配器中的 getSystemService 方法

我正在研究约翰霍顿的Android 编程初学者目前正在尝试创建一个笔记应用程序霍顿刚刚介绍ListViews 但是我遇到了麻烦adapter class public class NoteAdapter extends BaseAda
原型组件的 Spring 事件处理

假设我有两个组件 X 和 Y 其中 X 是单例而 Y 不是当我发布XUpdateEvent时没有问题我可以捕获该事件但是对于 YUpdateEvent 我无法捕获事件 Spring 为每个触发的事件创建新实例而不是使用已经创建
xsbt 插件 1.0.0-M7 和 scalatra

我尝试在我的 scalatra 项目中将 xsbt 插件升级到 1 0 0 M7 但 scalatra 似乎与此版本不兼容当我尝试重新加载项目时出现以下错误我尝试过 scalatra 2 3 0 版本问候德斯 java lang
javax.validation 的 @AssertTrue - 它不应该创建错误消息吗？

我在 Spring MVC 命令 bean 中有以下代码 AssertTrue public boolean isConditionTrue return false private boolean conditionTrue 我的 JSP
将项目导入 Eclipse 后出现“必须重写超类方法”错误

任何时候我必须将我的项目重新导入到 Eclipse 中如果我重新安装了 Eclipse 或者更改了项目的位置几乎全部我的重写方法的格式不正确导致错误该方法必须重写超类方法值得注意的是无论出于何种原因 Android 项目中方法参
在 Java 类型参数中，仅意味着严格的子类型？或者 E 也足够了吗？

在 Java 类型参数中是否仅意味着严格的子类型或者 E 也足够了吗这并不严格 E就足够了
android.R.layout.simple_list_item_1是什么？

在我看到的所有示例中他们在创建 ArrayAdapter 时仅使用 android R layout simple list item 1 android R layout simple list item 1是什么它只是一个名为sim
AWS Java SDK 中 DynamoDB v2 的迁移详细信息？

有没有人对新的命名空间进行了更改 com amazonaws services dynamodbv2 以及 AWS Java SDK 1 4 2 及更高版本中 DynamoDB 的接口本地二级指数的发布显然需要根据1 4 2 发行说明
Spark 数据帧分组、排序和选择一组列的顶部行

我正在使用 Spark 1 5 0 我有一个包含以下列的 Spark 数据框 user id description fName weight 我想做的是为每个用户选择前 10 行和后 10 行基于列权重的值数据类型为 Double 如
IntelliJ IDEA 中的项目语言级别是多少？

我正在使用 Java 7 SDK 和 IntelliJ IDEA IDE java version 1 7 0 11 Java TM SE Runtime Environment build 1 7 0 11 b21 Java HotSpo
java.lang.Object#getClass() 的 Eclipse 外部空注释

我正在使用 Eclipse Mars 中提供的外部空注释工具我正在尝试添加外部注释java lang Object getClass 但似乎无法正确签名我尝试过以下变体 NonNull Class getClass L1java lan
为什么永久代空间不断增长？

我读过几篇文章我理解以下内容如果我错了请纠正我和或编辑问题 java堆是这样分段的年轻代创建的对象放在这里这部分被频繁且廉价地垃圾收集老一代在年轻代的垃圾收集中幸存下来的对象会移到此处该区域的垃圾收集频率较低并且使用对
为什么在 this 方法中添加 If 语句会大大降低速度？

我在中遇到过这个回答另一个问题 https stackoverflow com questions 12233594 faster way to apply alpha to a jpeg in an android app 我试图诊断哪些
获取给定字符串日期中该月的最后一天

我的输入字符串日期如下 String date 1 13 2012 我得到的月份如下 SimpleDateFormat dateFormat new SimpleDateFormat MM dd yyyy Date convertedDat

随机推荐

如何在 AvalonEdit 中使文本居中？

我正在使用 ICSharpCode 的 AvalonEdit 文本编辑器并且有一个自定义 DocumentColorizingTransformer 我想将 ColorizeLine 内的某些文本行居中这可能吗我已经能够弄清楚如何以我
创建 deps.edn 文件时出现问题

大家我决定完全重写这篇文章以清晰的方式展示它首先感谢大家的支持我很感激这是 The Clojure Workshop Packt 中的练习我陷入了困境我的 IDE 是 IntelliJ 我使用的是 Windows 练习 4 1
正确的 chromium 浏览器品牌？

我正在研究 Chromium 叉子如何替换 Chromium 资源和应用程序包资源我发现有一天android branding res dirsgn 参数是介绍 https chromium googlesource com chro
没有窗口对象存在 webpack nodejs

我使用 webpack 和 babel 来编译我的 ecmascript 6 代码一切正常但如果我添加某些依赖项例如 requests npm 包这是我的文件 main js import os from os export cla
在 Info.plist 中指定设备系列

有没有一种方法可以仅根据 Info plist 中的键来指定设备系列而不更改构建设置我读过有关 UIDeviceFamily 在构建时自动添加到 Info plist 的信息并且文档说我不应该手动添加此键假设我无法使用 Xcode
Makefile 中 TARGET_ARCH 变量的用途是什么

我注意到 Gnu Make 中的隐式规则是变量 TARGET ARCH 例如 LINK o LOADLIBES LDLIBS o LINK o CC LDFLAGS TARGET ARCH 我认为交叉编译需要这个变量但我在 Gnu Mak
使用带有绝对链接的 dompdf

我正在使用标准 DOMPDF 代码来呈现现有网页例如1 http jasss soc surrey ac uk 16 2 1 html dompdf new DOMPDF dompdf gt set base path artpath d
将外部 CSS 转换为 Rails 中邮件的内联 CSS

我正在尝试创建一个应用程序该应用程序将发送样式繁重的电子邮件并要求客户端工作 Google Gmail 除外我研究了这个问题看起来 Gmail 删除了外部文件中的 CSS 或嵌套在 style 标签中的 CSS 是否存在将样式从外部
如何找出哪个 USB-RS232 设备位于哪个 tty 上？

我有两个基于相同 USB RS232 芯片的不同 USB 设备当我将它们插入 USB 时它们会安装到 dev ttyUSB0 3 我的问题是在脚本中我如何找出哪个脚本位于哪个 tty 上使用 lsusb 我可以区分它们 gt ls
Dart JS库，如何传递回调函数

我们正在尝试使用 Dart 包装器来包装 D3 v4 行生成器类https pub dartlang org packages js https pub dartlang org packages js 我们已经关注了https githu
如何在powershell中对xml文件使用if语句以及如何删除子标签及其内容

如何使用 if 语句并从该语句的输出中删除子标签 xml 文件中的 if 语句从我的代码中解析了所有 xml 文件现在我想检查 sessionType 是否等于我的 name 输入然后删除 int 标记之间的数据在不真正知道 XML 文
log4j2 是否有一个适配器可以在 slf4j 上工作？

我有一个使用 log4j2 的第三方库 elasticsearch 5 x 我的应用程序使用 slf4j 是否有适用于 log4j 版本 2 的适配器类似于版本 1 适配器 log4j over slf4j 只是为了澄清我不想实际使用
PHP反序列化没有匹配类的对象

我有包含序列化对象的数据库行我想反序列化这些但类已更改某些属性变为私有因此反序列化不再起作用有没有办法强制反序列化到数组或 stdClass 或任何在反序列化时不会导致错误的内容我想避免使用脚本迁移数据我宁愿向后兼容以旧格式序
Angular Dart 形式中的细粒度错误消息

我有以下表格和一些简单的验证规则
GetExportedTypes 抛出 MissingMethodException

当我调用 GetExportedTypes 时抛出 MissingMethodException 代码 Assembly LoadFrom assemblyPath GetExportedTypes 例外名称被混淆 System Mis
是否可以引用解决方案中存在的项目，并使用 NuGet 包引用作为后备（如果不在 .NET Core 中）？

我有一个 NET Standard 项目在其中实现了 ASP NET Core CMS 框架的模块目前它使用来自 NuGet 包的 CMS 框架库如果我从 GitHub 获取 CMS 框架的源代码并将我的模块添加到其解决方案中并
font Awesome 图标未出现在 IE 11 中，但显示在其他浏览器中

我对字体很棒的图标很陌生我有一个页面其中有一个过滤器用户可以在其中搜索数据我在搜索链接之前添加了 font Awesome 图标如下图所示我可以在除 IE 11 之外的所有浏览器中看到这个图标有趣的是我在其他页面中也有这个图标
Docker 容器知道 rbenv 全局但不知道 ruby

当运行我的 docker 容器时它知道 rbenv 全局但是当它尝试通过以下方式找到红宝石时ruby or which ruby or whereis ruby我什么也没得到它也认不出rails api or gem 到底是怎么回事
Spring 3 ArrayList 使用 Jackson 序列化为 JSON，无需包装到对象（无名称）

我有一个简单的资源应该返回 JSON 数组但它返回的对象是数组 RequestMapping value types method RequestMethod GET public List
SparkContext、JavaSparkContext、SQLContext 和 SparkSession 之间的区别？

有什么区别SparkContext JavaSparkContext SQLContext and SparkSession 是否有任何方法可以使用 a 来转换或创建上下文SparkSession 我可以使用一个条目完全替换所有上下文吗Sp

SparkContext、JavaSparkContext、SQLContext 和 SparkSession 之间的区别？

SparkContext、JavaSparkContext、SQLContext 和 SparkSession 之间的区别？ 的相关文章

随机推荐

热门标签

SparkContext、JavaSparkContext、SQLContext 和 SparkSession 之间的区别？的相关文章