控制 Akka 中消耗大量内存的 actor 的生成

2024-04-01

我使用 akka 的 actor 模型构建了一个分布式流机器学习模型。通过向 Actor 发送训练实例（训练数据）来异步训练模型。对这些数据的训练会占用计算时间并改变参与者的状态。

目前我正在使用历史数据来训练模型。我想运行一堆不同配置的模型，这些模型在相同的数据上进行训练，并查看不同的集成指标有何变化。本质上，这是对 Thread.sleep(1) 和表示计算时间和状态的数据数组进行的操作的简单得多的模拟。

implicit val as = ActorSystem()

case object Report

case class Model(dataSize: Int) {
  val modelActor: ActorRef = actor(new Act {
    val data = Array.fill(dataSize)(0)
    become {
      case trainingData: Int => {
        // Screw with the state of the actor and pretend that it takes time
        Thread.sleep(1)
        data(Math.abs(Random.nextInt % dataSize)) == trainingData
      }
      case Report => {
          println(s"Finished $dataSize")
          context.stop(self)
        }
      }
    })

  def train(trainingInstance: Int) = modelActor ! trainingInstance

  def report: Unit = modelActor ! Report
}

val trainingData = Array.fill(5000)(Random.nextInt)

val dataSizeParams = (1 to 500)

接下来我使用 for 循环来改变参数（由 dataSizeParams 数组表示）

for {
  param <- dataSizeParams
} {
  // make model with params
  val model = Model(param)
  for {
    trainingInstance <- trainingData
  } {
    model.train(trainingInstance)
  }
  model.report
}

for 循环绝对是我想做的事情的错误方式。它并行启动所有不同的模型。当 dataSizeParams 在 1 到 500 范围内时它效果很好，但是如果我将其提高到较高的值，我的模型每个都会开始占用明显的内存块。我想出的是下面的代码。本质上，我有一个模型大师，他可以根据他收到的运行消息的数量来控制同时运行的模型数量。现在，每个模型都包含对此主参与者的引用，并在处理完成后向他发送一条消息：

// Alternative that doesn't use a for loop and instead controls concurrency through what I'm calling a master actor
case object ImDone
case object Run

case class Model(dataSize: Int, master: ActorRef) {
  val modelActor: ActorRef = actor(new Act {
    val data = Array.fill(dataSize)(0)
    become {
      case trainingData: Int => {
        // Screw with the state of the actor and pretend that it takes time
        Tread.sleep(1)
        data(Math.abs(Random.nextInt % dataSize)) == trainingData
      }
      case Report => {
          println(s"Finished $dataSize")
          master ! ImDone
          context.stop(self)
        }
      }
    })

  def train(trainingInstance: Int) = modelActor ! trainingInstance

  def report: Unit = modelActor ! Report
}

val master: ActorRef = actor(new Act {
  var paramRuns = dataSizeParams.toIterator
  become {
    case Run => {
      if (paramRuns.hasNext) {
        val model = Model(paramRuns.next(), self)
        for {
          trainingInstance <- trainingData
        } {
          model.train(trainingInstance)
        }
        model.report
      } else {
        println("No more to run")
        context.stop(self)
      }
    }
    case ImDone =>  {
      self ! Run
    }
  }
})

master ! Run

主代码没有任何问题（我可以看到）。我可以严格控制一次生成的模型数量，但我觉得我缺少一种更简单/干净/开箱即用的方法来做到这一点。另外，我想知道是否有任何巧妙的方法来限制同时运行的模型数量，例如查看系统的 CPU 和内存使用情况。

您正在寻找工作拉动模式。我强烈推荐 Akka 开发者写的这篇博文：

http://letitcrash.com/post/29044669086/balancing-workload-across-nodes-with-akka-2 http://letitcrash.com/post/29044669086/balancing-workload-across-nodes-with-akka-2

我们在 Akka 的集群功能之上使用了一个变体，以避免流氓并发。通过工人演员pull工作而不是有主管push工作时，您可以通过简单地限制工作参与者的数量来优雅地控制工作量（以及 CPU 和内存使用量）。

与纯路由器相比，这有一些优点：更容易跟踪故障（如该帖子所述），并且工作不会在邮箱中滞留（可能会丢失）。

另外，如果您使用远程处理，我建议您not在消息中发送大量数据。让工作节点在触发时自行从另一个源提取数据。我们使用S3。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

控制 Akka 中消耗大量内存的 actor 的生成的相关文章

用惯用的 Scala 更新大型数据结构

我已经尝试 Scala 一段时间了并且经常遇到支持不可变数据结构的建议但是当你有一个像这样的数据结构时3D 场景图大型神经网络或任何具有大量需要频繁更新的对象的东西对场景中的对象进行动画处理训练神经网络这似乎是运行时效率极低
如何将模型从 ML Pipeline 保存到 S3 或 HDFS？

我正在尝试保存 ML Pipeline 生成的数千个模型正如答案中所示here https stackoverflow com questions 32121046 run 3000 random forest models by gro
如何以最佳方式传递元组参数？

如何以最佳方式传递元组参数 Example def foo Int Int def bar a Int b Int 现在我想传递的输出foo to bar 这可以通过以下方式实现 val fooResult foo bar fooResul
IntelliJ IDEA 13：新的 Scala SBT 项目尚未生成 src 目录结构

我按照 Jetbrains 网站上的入门视频设置 IntelliJ IDEA 13 1 Community Edition 以与 Scala 配合使用 Scala 插件 v0 36 431 已安装当我使用向导创建一个新的 Scala SB
Java Executor 根据 CPU 和 RAM 使用情况调整线程池

我的应用程序使用 Executor 为大量任务提供线程池通过分析和基准测试我确定当每个核心有多个线程时我的应用程序运行速度最快一个好的启发式方法是从每个核心 4 个线程开始不断变化直到达到 gt 90 CPU 或 gt 90 R
过滤字符串上的 Spark DataFrame 包含

我在用火花1 3 0 http spark apache org releases spark release 1 3 0 html and 火花阿夫罗1 0 0 https github com databricks spark avro
如何将 scala 列表转换为 javascript 数组？

有更简单的方法吗 document ready function var jsArray if scalaList null for id lt scalaList jsArray push id 很简单如下所示 import play
Spark日期格式问题

我在火花日期格式中观察到奇怪的行为实际上我需要转换日期yy to yyyy 日期转换后日期应为 20yy 我尝试过如下 2040年后失败 import org apache spark sql functions val df Seq
如何在Gradle中支持多种语言（Java和Scala）的多个项目？

我正在尝试将过时的 Ant 构建转换为 Gradle 该项目包含约50个Java子项目和10个Scala子项目 Java 项目仅包含 Java Scala 项目仅包含 Scala 每个项目都是由 Java 和 Scala 构建的这大大减慢
减少/折叠幺半群列表，但减少器返回任一

我发现自己遇到过几次这样的情况我有一个减速器组合 fn 如下所示 def combiner a String b String Either String String a b asRight String 它是一个虚拟实现但 fn
具有两个通用参数的上下文边界

在 Scala 中我可以使用上下文边界 def sort T Ordered t Seq T 与以下意思相同 def sort T t Seq T implicit def Ordered T 如果我有一个带有两个泛型参数的类怎么办 IE
选择 c 和 gamma 值

您好我正在使用 SMO 执行 SVM 分类其中我的内核是 RBF 现在我想选择c and sigma值使用网格搜索和交叉验证我是内核函数的新手请帮助一步一步的过程选择一些您认为有趣的 C 和 sigma 值例如 C 1 10
模拟 BlazeClientBuilder[IO] 以返回模拟客户端[IO]

我正在使用BlazeClientBuilder IO resource方法得到Client IO 现在我想模拟客户端进行单元测试但不知道该怎么做有没有一个好的方法来嘲笑这个我会怎么做 class ExternalCall val r
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
在 Spark MLlib 上使用 Java 中的 Breeze

在尝试从Java使用MLlib时使用微风矩阵运算的正确方法是什么例如scala 中的乘法很简单 matrix vector 相应的功能在Java中是如何表达的有一些方法例如 colon times 可以通过正确的方式调用 breez
Openresty 中的并发模型是什么？

我很难理解 openresty 或 nginx 的并发模型我读了Lua变量作用域 http wiki nginx org HttpLuaModule Lua Variable Scope 它解释了变量的生命周期但它没有说明对它们的并发访
Guzzle 中的“并发”到底是什么？

我没有找到太多关于concurrency选项中Pool 如果这是可以在服务器上打开的 TCP 套接字数量那么问题是我可以使用多少并发来更快地处理请求我有这个使用的例子Pool I am using Laravel this is ba
Scala中有类似Java Stream的“peek”操作吗？

在Java中你可以调用peek x gt println x 在 Stream 上它将对每个元素执行操作并返回原始流这与 foreach 不同 foreach 是 Unit Scala 中是否有类似的东西最好是适用于所有 Monady
在监督分类中，使用partial_fit() 的MLP 比使用fit() 的表现更差

我正在使用的学习数据集是灰度图像flatten让每个像素代表一个单独的样本第二张图像在训练后将被逐像素分类Multilayer perceptron MLP 前一个分类器我遇到的问题是MLP当它一次接收到所有训练数据集时表现更好 fit
如何在超时的情况下在单独的调度程序上运行 Akka Streams 图？

这个问题是基于我做过的一个宠物项目这个SO https stackoverflow com questions 34641861 akka http blocking in a future blocks the server 34645

随机推荐

从源代码构建 Clang 时什么时候需要 libc++ 源代码？

我多年来一直在 Linux 和 OS X 上构建 Clang LLVM 下载页面 http llvm org releases download html 我一直使用以下来源 LLVM LLVM 源编译器前端 Clang 源编译器 RT
在Python中混合yield和return语句是个好习惯吗？

我很想有以下行为 def foo bar None if bar return other function other thing bar else for i in other thing yield other function i
Discord JS - 交互创建和消息创建

我一直在尝试使用交互创建事件但不知何故它不起作用我不知道为什么而且我没有找到有关此事件的确切文档只知道它用于执行斜杠命令但是为了这个目的我使用消息创建事件并且运行良好 const Event require handlers E
点击透明图像像素

我不希望图像的透明部分可点击我发现
是否可以在 libGDX 中禁用帧限制？

更具体地说是一个桌面 libGDX LWJGL 应用程序有一些配置选项可以禁用 CPU 同步以及垂直同步但不管应用程序以 60 fps 运行这对于所有实际用途来说都很好但出于好奇如果没有别的原因我想看看帧速率可以达到多高罗德
CloudFront 如何在 S3 的现有分发服务网站上设置反向代理

我有一个 S3 存储桶它托管一个网站并通过 CloudFront 交付现在我已将发行版附加到我的顶点根域例如 www xyz com 因此之前我们使用 Nginx 从同一域上的网络服务器根提供静态前端 www xyz com 并且还
Chart.js 每个点的自定义图像

我正在使用 Chart js 并且正在寻求有关散点图上每个点的自定义图像的帮助我尝试过使用 javascript 图像数组但它不起作用我是 canvas 和 html5 的新手我想要的是每个点都是用户的小个人资料图片而不是圆圈一个
使用 Node.js 的文件系统观察器

我想使用 node js 实现文件系统观察器以便它监视特定目录中添加删除的任何文件有人可以给出如何实现这个的想法吗 Thanks 查看fs watchFile filename options listener http nodejs
通过模态加载动态 URL

假设我有以下由循环生成 X 次的链接 a class btn href Launch Modal a 这是启动模式的 JS 脚本 document ready function view more modal remote item vie
权限拒绝：打开提供程序 android.support.v4.content.FileProvider

我在尝试在 Android 模拟器中执行应用程序升级时遇到了一些问题场景的流程来自一个 Activity 我将执行异步任务A哪个打开片段A 然后在里面异步任务A 我会检查是否有版本升级如果可用并且用户选择了确定片段A 我将继续异步任
调用需要 API 级别 29（当前最低为 21）：`android.widget.NumberPicker#setTextColor`

我想使用 setTextColor 更改选定的文本颜色字段但是 Android Studio 给了我这个错误我应该怎么办最小 SDK 为 21 这是我的 CustomNumberPicker 类的代码 import android a
MongoDb 解释失败：“未知的顶级运算符：$query”

我试图从非常简单的查询中获得解释它使用具有以下架构的帖子集合 gt db posts findOne id ObjectId 55236e6182bf196454a952b6 Content wuOfCjKborHcxkoyXzXiW C
Mysql CASE WHEN JOIN 语句错误

Mysql查询 SELECT FROM pet info LEFT JOIN lostpets ON pet info id lostpets petid LEFT JOIN pet images ON pet info id pet im
页面加载后部分渲染

我有一个包含一些用户控件的页面我想在回发后加载这些用户控件就像 ajax 渲染一样每个用户控件都显示数据库中的列表我不希望用户在服务器代码构建响应时等待我认为如果为用户显示页面并且在通过 ajax 请求加载用户控件之后这将很有用
如何在未来取消时终止 Callable 中的 CXF Web 服务调用

Edit 这个问题现在已经经历了几次迭代所以请随意查看修订版本以了解有关历史和尝试过的事情的一些背景信息我将 CompletionService 与 ExecutorService 和 Callable 一起使用通过 CXF 生成的
包含 jQuery 会导致标准 JavaScript 停止运行？

我正在开始使用 jQuery 我一直在尝试将它与一些预先存在的 JavaScript 代码混合这样我就不必重写所有内容我读过很多地方都说这是完全可行的然而每当我包含任何 jQuery 行时标准 JavaScript 就会停止运行
RubyKoans：破损的公案？

可能是业余爱好者的标志我想知道问题是否出在公案而不是我但是考虑一下这个公案 def test calling global methods without parentheses result my global method 2
取消 ChangeNotifier 内的 Firebase 监听器

当我尝试取消 Firestore 侦听器时ProductsService cancel 我收到错误错误 flutter lib ui ui dart state cc 209 未处理的异常 LateInitializationError
JSF 2.0 validateRegex 带有自己的验证器消息

我有一个与此类似的代码
控制 Akka 中消耗大量内存的 actor 的生成

我使用 akka 的 actor 模型构建了一个分布式流机器学习模型通过向 Actor 发送训练实例训练数据来异步训练模型对这些数据的训练会占用计算时间并改变参与者的状态目前我正在使用历史数据来训练模型我想运行一堆不同配置的模型

控制 Akka 中消耗大量内存的 actor 的生成

控制 Akka 中消耗大量内存的 actor 的生成 的相关文章

随机推荐

热门标签

控制 Akka 中消耗大量内存的 actor 的生成的相关文章