如何使用apache Spark的MLlib的线性回归？

2023-12-31

我是apache Spark的新手，从MLlib的文档中，我找到了scala的示例，但我真的不知道scala，有人知道java中的示例吗？谢谢！示例代码是

import org.apache.spark.mllib.regression.LinearRegressionWithSGD
import org.apache.spark.mllib.regression.LabeledPoint

// Load and parse the data
val data = sc.textFile("mllib/data/ridge-data/lpsa.data")
val parsedData = data.map { line =>
  val parts = line.split(',')
  LabeledPoint(parts(0).toDouble, parts(1).split(' ').map(x => x.toDouble).toArray)
}

// Building the model
val numIterations = 20
val model = LinearRegressionWithSGD.train(parsedData, numIterations)

// Evaluate model on training examples and compute training error
val valuesAndPreds = parsedData.map { point =>
  val prediction = model.predict(point.features)
  (point.label, prediction)
}
val MSE = valuesAndPreds.map{ case(v, p) => math.pow((v - p), 2)}.reduce(_ +     _)/valuesAndPreds.count
println("training Mean Squared Error = " + MSE)

从文件MLlib http://spark.apache.org/docs/latest/mllib-guide.html thanks!

如文档中所示：

MLlib 的所有方法都使用 Java 友好的类型，因此您可以导入和在那里调用它们的方式与在 Scala 中的方式相同。唯一需要注意的是这些方法采用 Scala RDD 对象，而 Spark Java API 使用单独的 JavaRDD 类。您可以通过以下方式将 Java RDD 转换为 Scala：在 JavaRDD 对象上调用 .rdd()。

这并不容易，因为您仍然必须在 java 中重现 scala 代码，但它可以工作（至少在本例中）。

话虽如此，这是一个java实现：

public void linReg() {
    String master = "local";
    SparkConf conf = new SparkConf().setAppName("csvParser").setMaster(
            master);
    JavaSparkContext sc = new JavaSparkContext(conf);
    JavaRDD<String> data = sc.textFile("mllib/data/ridge-data/lpsa.data");
    JavaRDD<LabeledPoint> parseddata = data
            .map(new Function<String, LabeledPoint>() {
            // I see no ways of just using a lambda, hence more verbosity than with scala
                @Override
                public LabeledPoint call(String line) throws Exception {
                    String[] parts = line.split(",");
                    String[] pointsStr = parts[1].split(" ");
                    double[] points = new double[pointsStr.length];
                    for (int i = 0; i < pointsStr.length; i++)
                        points[i] = Double.valueOf(pointsStr[i]);
                    return new LabeledPoint(Double.valueOf(parts[0]),
                            Vectors.dense(points));
                }
            });

    // Building the model
    int numIterations = 20;
    LinearRegressionModel model = LinearRegressionWithSGD.train(
    parseddata.rdd(), numIterations); // notice the .rdd()

    // Evaluate model on training examples and compute training error
    JavaRDD<Tuple2<Double, Double>> valuesAndPred = parseddata
            .map(point -> new Tuple2<Double, Double>(point.label(), model
                    .predict(point.features())));
    // important point here is the Tuple2 explicit creation.

    double MSE = valuesAndPred.mapToDouble(
            tuple -> Math.pow(tuple._1 - tuple._2, 2)).mean();
    // you can compute the mean with this function, which is much easier
    System.out.println("training Mean Squared Error = "
            + String.valueOf(MSE));
}

它远非完美，但我希望它能让您更好地理解如何使用 Mllib 文档中的 scala 示例。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

apachespark

apachesparkmllib

如何使用apache Spark的MLlib的线性回归？的相关文章

无法解析类型为 xxx 的任何 bean；限定符：[@javax.enterprise.inject.Any()]

我有一个 LoginProvider 接口 public interface LoginProvider boolean login String username String password 以及两种不同的实现 public clas
使用 GWT CellTableBuilder 构建树表

Is it possible to build a tree table like this http www sencha com examples ExamplePlace basictreegrid with the new Cell
Android 2.2 SDK - Droid X 相机活动无法正常完成

我注意到我在 Droid X 上调用的默认相机活动与我的 Droid 和 Nexus One 上的默认相机活动看起来不同在 Droid 和 Nexus One 上选择确定后活动将完成 Droid X 有一个完成按钮它将带您返回
如何使用 SimpleDateFormat 解析多种格式的日期

我正在尝试解析文档中的一些日期用户似乎以类似但不完全相同的格式输入了这些日期以下是格式 9 09 9 2009 09 2009 9 1 2009 9 1 2009 尝试解析所有这些内容的最佳方法是什么这些似乎是最常见的但我想让我困扰
对话框上的 EditText 不返回任何文本

我太累了找不到错误我没有发现任何错误但我没有从 editText 收到任何文本请看下面的代码活动密码 xml
Spring安全“记住我”cookie在第一个请求中不可用

我无法在登录请求后检索 Spring 记住我 cookie 但它在对受保护页面的下一个请求中工作正常谁能告诉我怎样才能立即得到它我在登录请求中设置了记住我的 cookie 但在 Spring 重定向回原始受保护的 url 后无法检索它
如何在 JSP 中导入类？

我是一个完全的JSP初学者我正在尝试使用java util List在 JSP 页面中我需要做什么才能使用除以下类之外的类java lang 使用以下导入语句进行导入java util List 顺便说一句要导入多个类请使用以下格式
无法在 Spring Boot 测试中模拟 persistenceContext

我正在使用带有 Mockito 框架的 spring boot 测试来测试我的应用程序存储库类 EntityManager 之一作为参考我的班级如下所示 Repository Transactional Slf4j public cla
如何从 Retrofit2 获取字符串响应？

我正在做 android 正在寻找一种方法来执行超级基本的 http GET POST 请求我不断收到错误 java lang IllegalArgumentException Unable to create converter for
如何让spring为JdbcMetadataStore创建相应的schema？

我想使用此处描述的 jdbc 元数据存储 https docs spring io spring integration docs 5 2 0 BUILD SNAPSHOT reference html jdbc html jdbc met
如何获取 WebElement 的父级[重复]

这个问题在这里已经有答案了我试过了 private WebElement getParent final WebElement webElement return webElement findElement By xpath 但我得到
列表应该如何转换为具体的实现？

假设我正在使用一个我不知道源代码的库它有一个返回列表的方法如下所示 public List
Java 收集返回顶级项目的映射的嵌套流

我有以下模型 class Item String name List
逃离的正确方法是什么？使用 Oracle 12c MATCH_RECOGNIZE 时 JDBCPreparedStatement 中的字符？

以下查询在 Oracle 12c 中是正确的 SELECT FROM dual MATCH RECOGNIZE MEASURES a dummy AS dummy PATTERN a DEFINE a AS 1 1 但它不能通过 JDBC
JVM：是否可以操作帧堆栈？

假设我需要执行N同一线程中的任务这些任务有时可能需要来自外部存储的一些值我事先不知道哪个任务可能需要这样的值以及何时获取速度要快得多M价值观是一次性的而不是相同的M值在M查询外部存储注意我不能指望任务本身进行合作它们只不过是 ja
解决错误javax.mail.AuthenticationFailedException

我不熟悉java中发送邮件的这个功能我在发送电子邮件重置密码时遇到错误希望你能给我一个解决方案下面是我的代码 public synchronized static boolean sendMailAdvance String emai
Android - 9 补丁

我正在尝试使用 9 块图片创建一个新的微调器背景我尝试了很多方法来获得完美的图像但都失败了 s Here is my 9 patch 当我用Draw 9 patch模拟时内容看起来不错但是带有箭头的部分没有显示或者当它显示时这部
Java &= 运算符应用 & 或 && 吗？

Assuming boolean a false 我想知道是否这样做 a b 相当于 a a b logical AND a is false hence b is not evaluated 或者另一方面这意味着 a a b Bitwi
JAXB - 列表<可序列化>？

我使用 xjc 制作了一些课程 public class MyType XmlElementRefs XmlElementRef name MyInnerType type JAXBElement class required false
在哪里存储 Java 的 .properties 文件？

The Java教程 http download oracle com javase tutorial essential environment properties htmlon using Properties 讨论如何使用 Prop

随机推荐

Akka.Net Streams 和远程处理 (Sink.ActorRefWithAck)

我使用 Akka net Streams 做了一个非常简单的实现Sink ActorRefWithAck 订阅者向发布者请求一个大字符串发布者通过切片发送它它在本地 UT 工作得很好但是不远程我不明白出了什么问题具体来说订阅者能
如何在 Django 中拥有这样的 URL？

我怎样才能有这样的网址example com category catename operation 在姜戈此外在某些情况下用户输入空格分隔的类别我该如何处理例如如果用户输入我的家类别则该类别的 URL 将变为exampl
在 Azure Cosmos DB 中使用 Gremlin 重命名属性

我们的一些代码库已经更改因此它现在期望过去具有名称为 Sdg 的属性的顶点现在具有名称为 causeType 且具有相同值的属性简而言之财产的重命名在这一点上我已经尝试了很多而且令我有点惊讶的是弄清楚如何搜索图表并在需要时进行重
即使 JSON 已建立索引，查询中是否也需要分区键

我计划使用 Cosmos Db 文档 Db 并且尝试了解查询索引和分区如何相互关联如何在 Azure Cosmos Db 中进行分区和缩放 https learn microsoft com en us azure cosmos db
带有要排列的行的标量

如何转换包含数组中带有换行符的字符串的标量并将这些行作为元素例如考虑到这一点 lines line 1 nline 2 nline 3 n 我想检索这个 lines 0 gt line 1 n lines 1 gt line 2 n
有什么办法可以在网页上显示C++吗？

有没有一种相对简单的方法可以在网页上显示 C 程序的输出我并不是指手动换句话说您在网页上看到它因为它运行而不是像我制作代码标签并自己编写它一样编辑为了让每个人都能清楚地了解这一点我将把它发布在这里我不想用 C 制作网页如
根据索引初始化 MATLAB 矩阵

我正在尝试创建一个满足以下条件的矩阵 M M i j f i j 对于一些f 我可以通过说进行元素初始化M zeros m n 然后循环例如八度 M zeros m n for i 1 m for j 1 n m i j i j 2 e
如何将 C# 文档生成为 CHM 或 HTML 文件？

有没有办法直接从 Visual Studio 中从代码文档生成可读文档文件也考虑2010年代码示例
在父类中记录静态方法

我有一个抽象类 Parent 有 2 个子类 A 和 B Parent 有一个名为 do 的静态方法我想知道是否有一种方法可以让该静态方法在 A 类被称为 A do 时在 Logger 中添加日志信息在被称为 B do 时在 Logge
PHP Exception::getCode() 与其实现的 Throwable 接口相矛盾

我发现了一个我无法理解的矛盾异常 getCode https www php net manual en exception getcode php 有这样的定义 final公共异常 getCode 无效 mixed 附说明返回异常代码
什么存储位置（SQL Server 或文件系统）可以提高保存 tiff 图像的性能？

我们的系统需要存储大小约为 3k 的 tiff 图像我们在给定时间收到约 300 张图像需要快速处理它们一旦收到约 100 000 张图像这些图像就会从我们的系统转移到另一个存档系统或被清除我正在寻找图像文件初始保存的最佳性能传
有没有关于 gremlin 'match()' 如何工作的文档？

我正在用 match 遍历编写 gremlin 查询某些模式匹配的行为似乎与其他模式语言不同输入遍历器值如何与模式变量绑定 g V A B match as x as y project x y gt x v A y v A gt x
使用summary r 进行逻辑值计数

在数据框中我有一列包含 Y 和 N 值该数据框还有一个 id 列我想创建两列一列包含 Y 总数另一列包含每个 id 的 N 总数我尝试使用 dplyr summarise 函数执行此过程 group by id gt summa
Polymer 2.0 webcomponents-loader.js 缺少 Edge polyfill

我们目前将项目从 Polymer 1 更新到 Polymer 2 混合版本我知道 webcomponents hi sd ce js 是 Edge 的 polyfill 在 Microsoft Edge 上测试页面时我现在收到一条错误
服务器端验证 Facebook 用户

我正在编写一个 Facebook 应用程序其中列出了用户的朋友并与用户提供的有关他们的信息存储在 Google App Engine 数据库中进行交叉引用我的应用程序的运行方式如下用户登录 Facebook 后通过 Faceb
如何在页面刷新时保留无线电输入状态

我有一个表单如果用户提交有错误的表单以防页面刷新我需要在该表单上存储所有单选按钮的状态我想实现与此非常相似的目标 function example input type radio checked each function thi
如何检查复制快照代理状态？

我想在使用此语句启动代理后检查代理的状态 EXEC sp startpublication snapshot publication 因为我想做下一步需要工作已经开始我不相信有内置复制存储过程来检查快照代理状态我可能是错的但是您可
将 Maven 输出发送到文件

在 Windows 7 上我尝试发送maven 3命令到文本文件我从我试图分析的项目的根目录调用该命令命令是 mvn dependency tree Dverbose Dincludes commons collections Dou
具有零值双精度的奇怪 if 语句行为

有人愿意向我解释一下它的价值吗this oBalance QouteBalance因小于零而被评估为真但显然不是请参见下图在比较 C 中的双精度数时我是否遗漏了一些基本的东西 public double QouteBalance g
如何使用apache Spark的MLlib的线性回归？

我是apache Spark的新手从MLlib的文档中我找到了scala的示例但我真的不知道scala 有人知道java中的示例吗谢谢示例代码是 import org apache spark mllib regression L

如何使用apache Spark的MLlib的线性回归？

如何使用apache Spark的MLlib的线性回归？ 的相关文章

随机推荐

热门标签

如何使用apache Spark的MLlib的线性回归？的相关文章