通过 RStudio 加载 com.databricks.spark.csv

2023-12-04

我已经安装了Spark-1.4.0。我还安装了它的 R 包 SparkR，并且可以通过 Spark-shell 和 RStudio 使用它，但是，有一个我无法解决的差异。

启动 SparkR-shell 时

./bin/sparkR --master local[7] --packages com.databricks:spark-csv_2.10:1.0.3

我可以按如下方式读取 .csv 文件

flights <- read.df(sqlContext, "data/nycflights13.csv", "com.databricks.spark.csv", header="true")

不幸的是，当我通过 RStudio 启动 SparkR（正确设置我的 SPARK_HOME）时，我收到以下错误消息：

15/06/16 16:18:58 ERROR RBackendHandler: load on 1 failed
Caused by: java.lang.RuntimeException: Failed to load class for data source: com.databricks.spark.csv

我知道我应该以某种方式加载 com.databricks:spark-csv_2.10:1.0.3，但我不知道如何做到这一点。有人可以帮助我吗？

这是正确的语法（经过几个小时的尝试）：（注意 - 你必须关注第一行。注意双引号）

Sys.setenv('SPARKR_SUBMIT_ARGS'='"--packages" "com.databricks:spark-csv_2.10:1.0.3" "sparkr-shell"')

library(SparkR)
library(magrittr)

# Initialize SparkContext and SQLContext
sc <- sparkR.init(appName="SparkR-Flights-example")
sqlContext <- sparkRSQL.init(sc)


# The SparkSQL context should already be created for you as sqlContext
sqlContext
# Java ref type org.apache.spark.sql.SQLContext id 1

# Load the flights CSV file using `read.df`. Note that we use the CSV reader Spark package here.
flights <- read.df(sqlContext, "nycflights13.csv", "com.databricks.spark.csv", header="true")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

RStudio

sparkr

通过 RStudio 加载 com.databricks.spark.csv 的相关文章

当我每次启动 Desktop Rstudio 时，都会收到一条错误消息：rstudio error yaml.load readlin con errorlevel errorlevel

登录Desktop Rstudio后会出现以下消息 Error in yaml load readLines con error label error label object C unserialize from yaml not f
sink() 不会将输出打印到 rmarkdown 中的文本文件

假设我有一个简单的 rmarkdown 文档名为 test Rmd output pdf document This code tries to save output to a file called example txt r sin
Rstudio 正在命令行中复制命令

R 中有一个奇怪的问题似乎不知从何而来 RStudio 终端中的输出在我没有要求的情况下重复了即 gt 3 4 gt 3 4 1 7 1 7 其他人有这个问题并有任何想法如何解决吗我还想知道它是否实际上执行了两次命令并且大大减慢了速
Markdown 报告未在 Rstudio 中执行

我正在生成错误 gt options encoding UTF 8 require knitr knit March 2013 Report Rmd Loading required package knitr processing fil
R 噩梦：Yosemite、R、RStudio 和 Homebrew

我使用配备 OS X Yosemite 10 10 2 的 MacBook Pro 13 Retina 2013 年末我不希望我最大的敌人遇到这种情况也许吧噩梦按时间顺序排列从官方网站下载 R 和 RStudio 运行这两个应用程序
在 Rstudio 中使用 knitr 和在命令行中使用 knit2html 时，HTML 输出有所不同

我正在尝试使用 knit 从 R markdown 文件生成 html 文档当我在 R studio 中使用 knit html 按钮时它工作正常并且得到了我想要的输出然而当我在命令行中使用 knit2html 时输出 html
如何在 Rmarkdown 演示文稿（滑动）中回显代码之前显示块输出？

我最近开始在 Rmarkdown 中使用 Slidy 演示模板并且喜欢每张幻灯片如何允许您向下滚动以获取更多内容我使用它的一种方法是与我的学生共享绘图请参阅下面的示例代码在一张幻灯片上我可以显示绘图以及用于创建绘图的确切代码可以
rstudioapi AskForPassword 不屏蔽用户名输入

有没有办法禁用 rstudioapi askForPassword 弹出窗口中的屏蔽以便用户可以输入他们的用户名我正在构建一个可以与我的团队共享的函数用于使用 ROracle pacakge 连接到我们的 Oracle 数据库实例目
在 RStudio 中网络抓取 VIN 号码的品牌/型号/年份

我目前正在开展一个项目需要查找制造商型号和 VIN 编号年份我有 300 个不同 VIN 号码的列表检查每个单独的 VIN 号码并将制造商型号和年份手动输入到 Excel 中是非常低效且乏味的我尝试使用带有 SelectorGa
如何在 RStudio 中为包函数设置断点

要复制此错误您必须首先安装 MARSS 包我还包括用户指南 https cran r project org web packages MARSS vignettes UserGuide pdf https cran r project
在 Rstudio 中的 RMarkdown 中循环生成 pander 表

我使用类似于下面的代码片段的代码生成了一组表 r tables echo TRUE eval TRUE require reshape2 require pander data mtcars data AirPassengers dta l
如何在 R 中按下传单弹出窗口时创建事件？

当我单击传单多边形时我想让 tabPanel 变为闪亮我对如何做到这一点有一些想法但我找不到实现它们所需的信息我在选项卡面板中有传单但我想在单击多边形时切换到另一个选项卡 leaflet llmap gt addTiles gt
使用 nginx 代理时在 RStudio 中运行闪亮的应用程序

我正在尝试使用通过 nginx 代理的 RStudio 服务器来开发一个闪亮的应用程序当我使用 RStudio 而不是服务器来运行闪亮的应用程序时一切正常但是当我通过代理 RStudio 运行时该应用程序出现在查看器窗格中
R Studio：更改光标颜色

我在 R Studio 中使用 Cobalt 编辑器主题通过更改相应的 cache css 文件对其进行了稍微调整背景颜色是深色的我的选择但文本光标鼠标指针也是深色的因此很难看到在哪里或如何将鼠标指针颜色更改为例如 cach
如果我设置 echo=FALSE，R Markdown 会使自定义绘图消失

我创建了一个自定义函数它将 mfrow 设置为 nxn 并根据数据框的输入列表创建 n 2 个散点图每个图上有多个数据集我的绘图函数的签名如下所示 plot return list lt function df list num pl
R 笔记本：opts_chunk 没有效果

我正在开发我的第一台 R 笔记本除了一个问题之外它运行得很好我想成为我内联输出的数字 r realbignumber 以逗号作为分隔符且最多 2 位小数 123 456 789 12 为了实现这一目标我在文档的开头添加了一个块其中
加载包时 R 会话中止

我的 RStudio 0 99 879 R 3 2 3 OSX 10 11 3 崩溃R Session Aborted每次运行都会出现错误提示require ggvis v0 4 2 我已经重新安装了 R RStudio 和 ggvis 没
在四开图书模板中将数据从一个 qmd 文件传递到另一个 qmd 文件？

我能否就在 RStudio 四开图书模板中将数据从一个四开文件传递到另一个四开文件的最佳实践寻求建议默认的书籍模板如下所示 quarto yml project type book book title TestTest author J
在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei

随机推荐

如何在Matlab中设置相同的初始种子随机数？

我有一个 matlab 代码其中有一堆随机数例如 unifrnd 0 1 normrnd mu sigma 此类功能会一遍又一遍地重复有什么方法可以修复生成的随机数吗意思是一旦得到一些结果我就运行代码在第二次运行时我得到不同
Expression.Lambda 和运行时的查询生成，最简单的“Where”示例

我试图在运行时生成一个简单的 Lambda 表达式但没有成功如下所示 var result queryableData Where item gt item Name Soap 这是我的示例类和可查询的装置 public class I
C++中有128位整数吗？

我需要存储 128 位长UUID在一个变量中 C 中有128位数据类型吗我不需要算术运算我只是想非常快速地轻松存储和读取值 C 11 的新功能也不错尽管 GCC 确实提供 int128 仅支持整数模式宽度足以容纳 128 位的目标处
在 Apple 芯片（Big Sur、Monterey、Ventura）上为 Rcpp 和其他工具配置编译器

我正在尝试使用需要的包Rcpp在我的 M1 Mac 上使用 R 语言在购买这台计算机后我再也无法启动并运行它我将其更新到蒙特利希望这能解决一些安装问题但事实并非如此我尝试运行Rcpp检查来自这一页但我收到以下错误 gt Rcpp
使用 PHP 根据空格和括号进行拆分

我有这个字符串 s 本说 yellow 嘿目前我正在使用 parts array filter preg split s s 所以我有一个数组元素的输出 0 ben 1 say 2 yellow 3 hey 是否可以创建这样的数组结构 0
怎么解决这个问题。该进程无法访问该文件

该进程无法访问文件 F copy back up system HRM 2 5 2013 HRM HRM lanbased txt 因为该文件正在被另一个进程使用这是我在子主程序中的代码 Public localhost As Strin
使用 Qt QNetworkAccessManager 发送 HTTP 标头信息

我有以下代码我想在调用时添加一些 HTTP 标头信息无论如何我能做到吗 void NeoAPI call QString apiCall if this gt ApiCall contains apiCall QNetworkAcces
根据响应递归组合 HTTP 结果

有一个 API https panelapp genomicsengland co uk api v1 panels page 1 我想将所有数据消耗到我的角度应用程序中问题是他们的 API 有分页我想一次检索所有内容正如您在 API
无法绘制 MKPolylineView 交叉经度 +/-180

我在 MKMapView 上绘制 MKPolylineView 时遇到问题该线路代表一次环游世界的旅行起点和终点均在纽约附近始终向东行驶从日本到旧金山的旅程的其中一段跨越太平洋因此经度为 180 MKPolylineView 确实
如何获取 WFFM 字段的值作为标签并将其输出到 Sitecore DMS 报告中？

如果我创建一个启用了分析的 Web Forms For Marketers 表单我可以选择将每个字段作为标签添加到访客我看不到如何配置应将它们添加到哪个标签甚至看不到默认情况下该标签的名称我假设创建了带有字段名称的标签我还想知道如
OmniAuth 无效响应错误

我将 OmniAuth 与 Devise 结合使用允许用户使用 Facebook 登录或使用用户名和密码创建普通帐户当我最初设置这一切时我使用了来自铁路广播两个多月以来一切都运行良好但就在前几天 Facebook 登录停止工作
如何在同一主机上运行 Angular 2 客户端应用程序和 Node 服务器应用程序

我在 Angular 2 中构建了一个应用程序来从数据库获取数据并使用 node express 从服务器获取数据并将其提供给 Angular 客户端目前它们都运行在不同的本地主机上如何将它们组合成一个项目并在同一主机上运行假设您的
Android 管理 API：企业/策略列表？

这让我抓狂我已成功遵循Android 管理 API 快速入门创建项目企业策略并将其安装在设备上我愚蠢地没有写下企业或策略 ID 我尝试创建一个新集但非企业电子邮件现在给出错误表明它已经是另一个 EMM 的一部分控制台中是否有一
Heroku SSL 错误：密钥与 PEM 证书不匹配

我正在尝试使用 Heroku 建议的说明生成自签名证书 http www akadia com services ssh test certificate html 这将创建 sever key 和 server crt 然后我尝试使用以下
隐藏 UITableViewCell

有没有办法隐藏 UITableView 单元格我正在寻找一些可以在同步 cellForRowAtIndexPath 返回的 UITableViewCell 上调用的属性或方法以隐藏它并使其无法被用户选择对我来说使用映射并不是一个简单
如何获取并解析附加到 url 中的查询字符串？ PHP

我正在尝试开发一个 PHP 类它使我能够将查询字符串附加到 url 中并根据传递的变量对其进行处理如何才能做到这一点 Eg www example com var1 a var2 b var3 c 现在我想要得到 var1 a var
在 Lyx 中使用 Knitr 时出现 R 函数错误

使用summary 函数时出现错误 Lyx 中的针织者它前面的函数可以工作 lt lt gt gt library faraway head teengamb mdl lt lm gamble sex status data teenga
如何在 Jenkins 托管的网格上使用 Chromedriver 设置 Selenium

我刚刚迈出了使用 Selenium 的第一步我成功设置了一个测试 Firefox 驱动程序在我的 Jenkins 上的 Selenium 网格上运行使用 Jenkins Selenium Grid 插件我还在运行 Jenkins 的
JavaScript sweetAlert 弹出窗口在一秒钟后自行关闭

我有一个 SweetAlert 弹出窗口但它会自动关闭通常它应该保留到用户单击确定为止我已经包含并测试了所有 SweetAlert 文件
通过 RStudio 加载 com.databricks.spark.csv

我已经安装了Spark 1 4 0 我还安装了它的 R 包 SparkR 并且可以通过 Spark shell 和 RStudio 使用它但是有一个我无法解决的差异启动 SparkR shell 时 bin sparkR master

通过 RStudio 加载 com.databricks.spark.csv

通过 RStudio 加载 com.databricks.spark.csv 的相关文章

随机推荐

热门标签