Spark Streaming 中的 ML 模型更新

2024-04-26

我通过 Spark 批处理作业在 HDFS 中保留了机器学习模型,并且我在 Spark 流中使用它。基本上,ML 模型从 Spark Driver 广播到所有执行器。 有人可以建议我如何在不停止 Spark Streaming 作业的情况下实时更新模型吗?基本上,当有更多数据点可用时,就会创建一个新的 ML 模型,但不知道如何将新模型发送到 Spark 执行器。 还请求发布一些示例代码。

问候, 迪帕克.


最好的方法可能是每批次更新模型 https://stackoverflow.com/a/43392118/790075。由于您可能不想更新得太频繁,因此您可能想要检查您是否确实需要加载模型并在可能的情况下跳过它 https://stackoverflow.com/questions/45031215/how-to-update-rdd-periodically-in-spark-streaming.

对于存储在 hdfs 上的模型,您只需在更新保存已加载模型的变量的值之前检查模型文件上的新时间戳(或目录中存在的新模型)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Spark Streaming 中的 ML 模型更新 的相关文章

随机推荐

  • C# 使用 Linq Expression 进行动态数据库过滤

    我尝试创建通用方法来过滤数据库中的不同实体 以避免为每个实体创建庞大的方法 并使用非常相似的 if 语句组合过滤规则 现在我正在尝试创建表示相等比较的表达式 作为描述要比较的属性和某个值的参数表达式 我的概念如何解决问题以及我根据以下代码片
  • 互动倒计时增加?

    我有一个表单 如果没有完成任何鼠标交互 我想在 5 秒后关闭它 但如果完成任何鼠标交互 我希望它关闭countdown 5 seconds每次交互都会增加 5 秒 这是我到目前为止想到的 int countdown 5 System Tim
  • 将多个 Excel 工作表范围转换为 PDF VBA

    下面的代码是获取 Col E 的状态 如果它是 Include 那么其相应的工作表范围将被转换为 PDF 我已经尝试过了 但它无法正常工作并收到错误invalid procedure call or argument在线上 rng Expo
  • 如何让网络工作者跨域、多浏览器工作? IE SCRIPT5022:安全错误

    我创建了从单独的文件和内联工作人员 blob 调用的网络工作人员 这两种方法在大多数浏览器中都无法一致工作 我按照下面的教程使用 COR http www html5rocks com en tutorials workers basics
  • 使用 pROC 绘制 ROC 曲线失败

    我有一个数据集 其组织方式如下 gt head crypto data time btc price btc change btc change label eth price block size difficulty estimated
  • 如何在具有受保护功能的 React Router 中映射路由?

    我尝试使用映射和受保护函数中的 React Route 处理我的代码 This 组件数组 import LoginContainers from Containers LoginContainers LoginContainers impo
  • 为什么 Java 和 C# 没有隐式转换为布尔值?

    自从我开始使用 Java 以来 它不支持从数字类型到布尔值的隐式转换 这对我来说非常恼火 所以你不能做这样的事情 if flags 0x80 相反 你必须经历这种疯狂 if flags 0x80 0 null 和对象也是如此 我所知道的所有
  • JAVA - 如何将一个对象的属性复制到另一个具有相同属性的对象?

    假设我们有一个对象 A 定义如下 public class ObjectA private Attribute a1 private Attribute a2 private Attribute a3 由于某种原因 我需要创建第二个对象 B
  • 类型“Request”上不存在属性“”

    当试图延长Request包中的接口express要添加一些自定义属性 我收到以下打字稿错误 TS2339 Property does not exist on type Request
  • 如何在pyplot中自动标注最大值

    我试图弄清楚如何自动注释图形窗口中的最大值 我知道您可以通过手动输入 x y 坐标来注释您想要使用的任何点来完成此操作 annotate 方法 但我希望注释是自动的 或者自己找到最大值点 到目前为止 这是我的代码 import matplo
  • JMX 的使用以及如何用于现有应用程序

    几年前我们就在 JDK 5 上开发了分布式 Web 应用程序 JMX 将如何帮助这个应用程序 1 它能帮助我监控性能 内存 CPU 以及网络和磁盘 IO 吗 2 如果是这样 那么应用程序部署在多个服务器中 我如何在一个仪表板中进行监控 3
  • 为什么所有的 Active Record 都讨厌? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 如何在 Ruby 中将…(省略号)更改为…(三个句点)?

    我正在解析这个文件 http msdn microsoft com en us library ms189782 aspx using nokogiri 我发现有一些 省略号 该页面中的字符且无法删除 我想知道如何用Ruby来替换所有 省略
  • JavaScript 正则表达式异常(无效组)

    我有以下正则表达式 lt index d g 我正在尝试在像这样的字符串中查找索引整数 some text index 1 id 2 value 3 该表达式在 php 中工作正常 但在 javascript 中不起作用 我收到以下错误 未
  • 以正常形式打印浮点数,而不是指数形式/科学记数法[重复]

    这个问题在这里已经有答案了 我有一个以指数形式打印的数字 gt gt gt gt gt gt a 1 1221759 gt gt gt print a 8 184920266599223e 07 gt gt gt 我怎样才能让它以正常形式打
  • 如何在express和node中从html表单发送put请求

    我有一个用于编辑对象的表单 我想使用 Express 3 x 和 node js 正确处理它 编辑物品路线 item edit显示用于编辑对象的表单 我想我有三个选择 1 放置一个值为 edit 的隐藏字段 这样我就可以在express中正
  • 使用 MVCMailer 尝试发送到非本地电子邮件地址时,邮件服务器需要身份验证

    我想向用户发送新闻通讯电子邮件 我已经这样做了 public ActionResult SendNewsLetter userMailer NewsLetter Send return View 在 userMailer 类中 public
  • 基于超简单静态文件(html)的php站点缓存

    我有一个网站 基本上只显示内容 没有任何表格和后期处理 该网站基于 PHP 并托管在共享主机上 它很少改变 我想为此网站启用缓存 它是共享托管 所以我需要一个解决方案 不使用 Memcached 不需要将我的网站移至 VPS 不要使用APC
  • 如何删除firestore自动生成的单字段索引?

    update 太长了 如果您到达这里 您应该重新检查构建数据库的方式 随着时间的推移 您的文档可能会被消耗 由于嵌套列表等 原问题 我有一个包含很多字段的文档集合 我不查询文档 甚至不查询简单的查询 我只使用 db collection m
  • Spark Streaming 中的 ML 模型更新

    我通过 Spark 批处理作业在 HDFS 中保留了机器学习模型 并且我在 Spark 流中使用它 基本上 ML 模型从 Spark Driver 广播到所有执行器 有人可以建议我如何在不停止 Spark Streaming 作业的情况下实