Scala 中并行集合的效率/可扩展性（图）

2024-02-06

因此，我一直在 Scala 中使用并行集合来处理我正在开发的图形项目，我已经定义了图形类的基础知识，它目前正在使用scala.collection.mutable.HashMap关键在哪里Int其值为ListBuffer[Int]（邻接表）。（编辑：此后已更改为ArrayBuffer[Int]

几个月前我用 C++ 做了类似的事情，std::vector<int, std::vector<int> >.

我现在想做的是在图中的所有顶点对之间运行一个度量，所以在 C++ 中我做了这样的事情：

// myVec = std::vector<int> of vertices
for (std::vector<int>::iterator iter = myVec.begin(); iter != myVec.end(); ++iter) {
    for (std::vector<int>::iterator iter2 = myVec.begin(); 
        iter2 != myVec.end(); ++iter2) {
        /* Run algorithm between *iter and *iter2 */
    }
}

我在 Scala 中做了同样的事情，并行化，（或尝试）这样做：

// vertexList is a List[Int] (NOW CHANGED TO Array[Int] - see below)
vertexList.par.foreach(u =>
  vertexList.foreach(v =>
    /* Run algorithm between u and v */
  )
)

C++版本显然是单线程的，Scala版本有.par所以它使用并行集合，并且在 8 核（同一台机器）上是多线程的。然而，C++ 版本在大约 3 天内处理了 305,570 对，而 Scala 版本迄今为止仅在 17 小时内处理了 23,573 对。

假设我做了我的math http://www.wolframalpha.com/input/?i=%28%2850%20%2a%206115%29%20/%20%283%2a24%29%29%20/%20%2823573/17%29正确的是，单线程 C++ 版本大约比 Scala 版本快 3 倍。 Scala 真的比 C++ 慢很多吗？还是我完全误用了 Scala（我最近才开始使用 Scala，我已经读了大约 300 页的《Scala 编程》了）？

谢谢！ -kstruct

EDIT要使用 while 循环，我需要做类似的事情吗？

// Where vertexList is an Array[Int]
vertexList.par.foreach(u =>
  while (i <- 0 until vertexList.length) {
    /* Run algorithm between u and vertexList(i) */
  }
}

如果你们的意思是对整个事情使用 while 循环，是否有等效的.par.foreach一会儿？

EDIT2等一下，该代码甚至都不正确 - 我的错。我如何使用 while 循环并行化它？如果我有一些var i跟踪迭代，那么所有线程都不会共享它i?

从您的评论中，我看到您更新了共享可变HashMap在每个算法运行结束时。如果你随机散步，共享Random也是一个争论点。

我建议进行两项更改：

Use .map and .flatMap返回不可变集合而不是修改共享集合。
Use a ThreadLocalRandom（从任一Akka http://doc.akka.io/api/akka/2.0/#akka.jsr166y.ThreadLocalRandom%24 or Java 7 http://docs.oracle.com/javase/7/docs/api/java/util/concurrent/ThreadLocalRandom.html) 减少随机数生成器上的争用
检查算法的其余部分以了解更多可能的争用点。
您也可以尝试并行运行内部循环。但如果不了解你的算法，就很难知道这是否有帮助或有害。幸运的是，运行并行和顺序收集的所有组合非常简单；只是关掉pVertexList and vertexList在下面的代码中。

像这样的东西：

val pVertexList = vertexList.par
val allResult = for {
  u <- pVertexList
  v <- pVertexList
} yield {
  /* Run algorithm between u and v */
  ((u -> v) -> result)
}

价值allResult将是一个ParVector[((Int, Int), Int)]。您可以致电.toMap将其转换为Map.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Scala 中并行集合的效率/可扩展性（图）的相关文章

scala中的反引号有什么用[重复]

这个问题在这里已经有答案了我在一本书上找到了以下代码 val list List 5 4 3 2 1 val result 0 list running total next element running total next elem
Slick和bonecp：org.postgresql.util.PSQLException：FATAL：抱歉，太多客户端已经错误

当我在本地开发应用程序时我使用以下命令启动我的 play2 应用程序sbt run 我喜欢如何更改代码然后重新加载浏览器以查看我的更改在大约 10 次代码更改之后我收到 postgresql 太多连接错误见下文我的数据库连接使用
解决“Show”类型类实例的隐式问题

我正在努力使Gender实施Show类型类 scala gt trait Gender extends Show Gender defined trait Gender scala gt case object Male extends G
如何在超时的情况下在单独的调度程序上运行 Akka Streams 图？

这个问题是基于我做过的一个宠物项目这个SO https stackoverflow com questions 34641861 akka http blocking in a future blocks the server 34645
具有继承类型的 Aux 模式推理失败

我有一个复杂的玩具算法我希望纯粹在类型级别上表示根据饮食要求选择当天菜肴的修改对卷积表示歉意但我认为我们需要每一层才能达到我想要使用的最终界面我的代码有一个问题如果我们表达一个类型约束Aux 模式生成的类型基于另一个泛型类型它
Scala Spark 包含与不包含

我可以使用 contains 过滤 RDD 中的元组如下所示但是使用不包含来过滤 RDD 又如何呢 val rdd2 rdd1 filter x gt x 1 contains 我找不到这个的语法假设这是可能的并且我没有使用Dat
d3力定向布局-链接距离优先

在 d3 中使用力导向布局如何使链接距离成为优先事项同时仍然保持良好的图形布局如果我指定动态链接距离但保留默认费用则我的图形距离会因费用函数而发生一些变形并且不再是准确的距离但是如果我删除电荷图表将如下所示任何建议表示赞
Java 拥有闭包后 Scala 的优势 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案随着 Java 中添加了闭包作为语言选择 Scala 相对于 Java 的优势是什么有人可以详细说明一下有什么优点吗除了闭包 J
了解 Spark 中的 DAG

问题是我有以下 DAG 我认为当需要洗牌时火花将工作划分为不同的阶段考虑阶段 0 和阶段 1 有些操作不需要洗牌那么为什么 Spark 将它们分成不同的阶段呢我认为跨分区的实际数据移动应该发生在第 2 阶段因为这里我们需要cogr
如何调用 Scala 抽象类型的构造函数？

我试图弄清楚如何调用 Scala 抽象类型的构造函数 class Journey val length Int class PlaneJourney length Int extends Journey length class BoatJ
Spark：查找前 n 个值的高性能方法

我有一个很大的数据集我想找到具有 n 个最高值的行 id count id1 10 id2 15 id3 5 我能想到的唯一方法是使用row number没有分区就像 val window Window orderBy desc coun
在 scala 宏中使用 LabelDef (2.10)

我正在尝试 scala 2 10 宏功能我使用时遇到问题LabelDef但在某些情况下在某种程度上我偷看了编译器的代码阅读了摘录米格尔加西亚的论文 http lampwww epfl ch magarcia但我还是卡住了如果我的
在没有匹配器的情况下如何跳过specs2中的测试？

我正在尝试使用 scala 中的 specs2 测试一些与数据库相关的内容目标是测试 db running 然后执行测试我发现如果数据库关闭我可以使用 Matcher 类中的 orSkip 问题是我正在获取一个匹配条件的输出作为
过滤器的 Scala 集合类型

假设您有一个 List 1 1 其类型为 List Any 这当然是正确的且符合预期现在如果我像这样映射列表 scala gt List 1 1 map case x Int gt x case y String gt y toInt 结
HDFS：使用 Java / Scala API 移动多个文件

我需要使用 Java Scala 程序移动 HDFS 中对应于给定正则表达式的多个文件例如我必须移动所有名称为 xml从文件夹a到文件夹b 使用 shell 命令我可以使用以下命令 bin hdfs dfs mv a xml b 我可以
从数据框中绘制多条平滑线

我对 R 比较陌生我正在尝试绘制从 csv 文件加载的数据框数据由 6 列组成如下所示 xval col1 col2 col3 col4 col5 第一列 xval 由一系列单调递增的正整数例如 10 40 60 等组成其他列
InvalidRequestException（为什么：empid 如果包含 Equal，则不能被多个关系限制）

这是关于我从 Apache Spark 查询 Cassandra 时遇到的问题 Spark 的正常查询工作正常没有任何问题但是当我使用关键条件进行查询时出现以下错误最初我尝试查询复合键列族它也给出了与下面相同的问题由以下原因引
ScalaTest v3：为什么需要实现convertToLegacyEqualizer

Using 斯卡拉测试3 0 0 http www scalatest org install环境 Scala 2 11 8 sbt 0 13 5 IntelliJ 14 1 4 build sbt 只有 NOTE not using or
Spark-1.6.1 上的 DMLC 的 XGBoost-4j

我正在尝试在 Spark 1 6 1 上使用 DMLC 的 XGBoost 实现我能够使用 XGBoost 训练我的数据但在预测方面面临困难我实际上想以在 Apache Spark mllib 库中完成的方式进行预测这有助于计算训练
Slick：将操作与 DBIOAction 的 Seq 组合起来

我有工作以下代码 val actions for lt slickUsers insertOrUpdate dbUser loginInfo lt loginInfoAction lt slickUserLoginInfos DBUse

随机推荐

如何发布和订阅非 Mongodb 的数据？

Meteor publish 设置执行一些异步请求例如 API 然后返回要在 React 组件中显示的数据的过程是什么发布是如何工作的以及客户端代码如何访问它如果可能的话我想用 withTracker 函数来做到这一点谢谢本指南
如何将标签或按钮恰好放置在表单的中间？

我找不到将标签或按钮精确放置在表单中间的工具或属性例如在 X 轴上对比 2015 年 Design time 在我的 VisualStudio2010 中我有这 2 个按钮用于水平和垂直居中它位于工具栏布局中如果没有您可以
WebView，将本地 .CSS 文件添加到 HTML 页面？

在 android 中我使用 WebView 来显示我使用 Apache 的 HttpClient 从互联网获取的网页的一部分为了只从 html 中获取我想要的部分我使用 Jsoup String htmlString EntityU
Python 是否存在与素数相关的函数库？

我刚刚实施了米勒拉宾测试 http en wikipedia org wiki Miller E2 80 93Rabin primality test以及一个用于分解数字的简单函数两者都可以做得更好至少米勒拉宾测试是众所周知的那么
如何在 Visual Studio 2015 中使用 clang 编译适用于 Windows 的 C++

据我了解 Visual Studio 2015 附带了 clang 首先我以为这仅适用于 Android 和 iOS 应用程序但根据本文 http blogs msdn com b vcblog archive 2015 05 01 b
对于相同的数据，为什么 scipy.stats.gaussian_kde() 比 seaborn.kde_plot() 慢？

在 python 3 7 中我有这个 numpy 数组其形状 2 34900 该数组是一个坐标列表其中索引 0 表示 X 轴索引 1 表示 y 轴当我使用 seaborn kde plot 来可视化该数据的分布时在 i5 第七代
是否可以创建一个 DateFormatter 将两位数年份转换为四位数年份？

在我的 Java 应用程序中我使用DateFormat解析日期输入的实例 DateFormat fmt fmt DateFormat getDateInstance DateFormat DEFAULT dd MM yyyy for de
谷歌地图地理编码器返回状态

我正在使用谷歌地图地理编码器对邮政编码进行地理编码我希望它返回邮政编码所在的状态并将其存储在变量 local 中我收到一条错误消息表明 local 未定义为什么参见下面的代码 var address document getEle
定义读写操作符 [ ]

在 The C Programming Language 一书中作者给出了以下示例以及几条语句定义一个用于读取和写入的运算符例如是很困难的因为简单地返回引用并让用户决定如何处理它是不可接受的 cref 是帮助实现一个区分读和写的下
使用 .replaceWith 删除
标签但将内容保留在标签内？

我有一个表格单元格其中包含包含在内的内容 p tags td class address td p p Content goes here p 我想要 p 标签被删除所以它看起来像这样 td class address Content
MSysObjects 错误没有读取权限

我正在尝试通过以下方式连接到 MS Access 数据库 mdb OleDb 我的查询是 SELECT FROM ListQueries 这让我犯了错误 SQL 执行错误执行的 SQL 语句 SELECT FROM ListQueries
javascript中获取小数点后的值

我有一个 JavaScript 号码 12 1542 我想要这个字符串中的新字符串 12 1542 60 我怎么才能得到它谢谢你可以使用模运算符 https developer mozilla org en JavaScript Ref
SDK.DIR丢失？安卓更新项目？

当我这样做时我收到此错误 ant release sdk dir is missing Make sure to generate local properties using android update project or to i
jsTree - 渲染优化|具有 2000 个节点的超长渲染

我正在使用 jsTree 1 0 rc3 以及通过 AJAX 加载数据的选项并且在通过它加载大约 2000 个子节点时遇到问题虽然服务器会在几秒钟内响应但 jsTree 仅需要大约 40 秒才能在浏览器 chrome FF 中呈现结果
使用Python下载Kaggle数据集

我已经尝试下载kaggle dataset通过使用Python 但是我在使用时遇到了问题request方法和下载的输出 csv 文件是损坏的 html 文件 import requests The direct link to the Ka
Java 生成 RSA 密钥对并转换为 PEM - 但 OpenSSL 函数 PEM_read_bio_RSA_PUBKEY 返回 null

我使用以下代码生成 RSA 密钥对并将其转换为 PEM 但是当我使用OpenSSL功能时PEM read bio RSA PUBKEY是返回null Java代码 public static RSAKeyPair creatKeyPair
如何从数据子集中随机抽取并在 R 中引导统计测试

我有一个包含两个变量的数据集我希望统计测试它们在引导循环中是否相关即使用 Spearman 的等级校正cor test 我的数据集中的大多数测量值都来自独立的样本单位我们称之为植物单位尽管有些测量值来自同一植物为了处理伪复制问题
Azure ACS 是否像 Salesforce 一样支持 saml 2.0 IdP？

我没有安装访问控制服务 ACS 但我在一些在线视频演示中看到 Salesforce 不在可用的预安装身份提供商列表中 Salesforce 可以配置为 IdP 使用标准 SAML 2 0 我可以设置 ACS 以便使用 Salesforce
如何将组内的第一个值与每个后续值进行比较，直到满足条件

所以我有一个一般结构如下的数据框数据框 rownum group date 1 a 2021 05 01 2 a 2021 05 02 3 a 2021 05 03 4 b 2021 05 15 5 b 2021 05 17 6 b 20
Scala 中并行集合的效率/可扩展性（图）

因此我一直在 Scala 中使用并行集合来处理我正在开发的图形项目我已经定义了图形类的基础知识它目前正在使用scala collection mutable HashMap关键在哪里Int其值为ListBuffer Int 邻接表编

Scala 中并行集合的效率/可扩展性（图）

Scala 中并行集合的效率/可扩展性（图） 的相关文章

随机推荐

热门标签

Scala 中并行集合的效率/可扩展性（图）的相关文章