Spark 上的 MC-斯坦？

2024-01-12

我希望使用MC-Stan http://mc-stan.org/ on Spark http://spark.apache.org/，但谷歌搜索似乎没有相关页面。

我想知道这种方法在 Spark 上是否可行，因此如果有人让我知道，我将不胜感激。

此外，我还想知道在 Spark 上使用 MCMC 的广泛使用的方法是什么。我听说 Scala 被广泛使用，但我需要一些具有像样的 MCMC 库的语言，例如 MC-Stan。

是的，这当然是可能的，但需要更多的工作。 Stan（以及我所知道的流行的 MCMC 工具）并非设计为通过 Spark 或其他方式在分布式环境中运行。一般来说，分布式 MCMC 是一个活跃的研究领域。对于最近的评论，我推荐第 4 节可扩展贝叶斯推理的模式 http://arxiv.org/abs/1602.05221（PoFSBI）。您可能想要拆分大型 MCMC 计算有多种可能的方法，但我认为更直接的方法之一是拆分数据并在每个分区上运行具有相同模型的现成工具（例如 Stan）。每个模型都会产生一个次后部可以一起减少以形成后部。 PoFSBI 讨论了组合此类次后验的几种方法。

I've 放在一起 https://gist.github.com/strongh/0ba143d21e2382e3ec61f6a0bdc2f55d使用 pyspark 和 pystan 进行了非常粗略的概念验证（python 是对 Stan 和 Spark 支持最多的通用语言）。这是 PoFSBI 中加权平均一致性算法的粗略且有限的实现，在小型 8 所学校数据集上运行。我不认为这个例子实际上非常有用，但它应该提供一些关于将 Stan 作为 Spark 程序运行可能需要的东西的想法：分区数据，在每个分区上运行 stan，组合子后部。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

stan

Spark 上的 MC-斯坦？的相关文章

Spark：如何从spark shell运行spark文件

我正在使用CDH 5 2 我能够使用火花外壳运行命令如何运行包含 Spark 命令的文件 file spark 有没有办法在没有 sbt 的情况下在 CDH 5 2 中运行编译 scala 程序在命令行中您可以使用 spark sh
Spark：有没有办法打印出spark-shell和spark的类路径？

我可以在 Spark shell 中成功运行 Spark 作业但是当它打包并通过 Spark submit 运行时我收到 NoSuchMethodError 这向我表明类路径存在某种不匹配有没有办法可以比较两个类路径某种日志记录语句
计算行的排名

我想根据一个字段对用户 ID 进行排名对于相同的字段值排名应该相同该数据位于 Hive 表中 e g user value a 5 b 10 c 5 d 6 Rank a 1 c 1 d 3 b 4 我怎样才能做到这一点可以使用ra
在 Spark Dataframe 中提取数组索引

我有一个带有数组类型列的数据框例如 val df List a Array 1d 2d 3d b Array 4d 5d 6d toDF ID DATA df org apache spark sql DataFrame ID strin
如何使用列的平均值将列添加到 DataFrame

有没有更好的办法 val mean df select avg date first getDouble 0 df withColumn mean lit mean 我认为避免采取行动是值得的可以使用以下方法避免额外的操作broadcas
Spark SQL / PySpark 中的逆透视

我手头有一个问题陈述其中我想在 Spark SQL PySpark 中取消透视表我已经浏览了文档我可以看到仅支持pivot 但到目前为止还不支持取消透视有什么方法可以实现这个目标吗让我的初始表如下所示 When I pivotPy
Python Spark DataFrame：用 SparseVector 替换 null

在 Spark 中我有以下名为 df 的数据框其中包含一些空条目 id features1 features2 185 5 0 1 4 0 1 0 null 220 5 0 2 3 0 1 0 10 1 2 6 0 1 225 null
司机下令停车后 Spark 工作人员停下来

基本上主节点也充当从节点之一一旦主服务器上的从服务器完成它就会调用 SparkContext 来停止因此该命令传播到所有从服务器从而在处理过程中停止执行其中一名工作人员登录时出错信息 SparkHadoopMapRedUtil
如何使用 Scala 在 Spark 中漂亮地打印 JSON 数据帧？

我有一个数据帧我想将其作为有效的 json 写入 json 文件我当前的代码如下所示 val df DataFrame myFun df toJSON saveAsTextFile myFile json 输出的格式为如何将文件内容组
Spark Scala：按小时或分钟计算两列的 DateDiff

我在数据框中有两个时间戳列我想获取它们的分钟差异或者小时差异目前我可以通过四舍五入获得日差 val df2 df1 withColumn time datediff df1 ts1 df1 ts2 但是当我查看文档页面时https
如何从 Databricks Delta 表中删除列？

我最近开始发现 Databricks 并遇到了需要删除增量表的特定列的情况当我使用 PostgreSQL 时它就像 ALTER TABLE main metrics table DROP COLUMN metric 1 我正在浏览 Da
Spark - scala - 如何检查配置单元中是否存在表

我必须使用 Spark 1 6 2 scala 检查配置单元中是否存在表如果没有我必须创建一个空数据框并将其保存为配置单元表如果存在则覆盖现有表我需要一个返回布尔值的函数基于该函数我可以做出上述决定是否创建新表或覆盖现有表 1
无法在 SBT 中运行 Apache Spark 相关单元测试 - NoClassDefFoundError

我有一个简单的单元测试使用SparkContext 我可以在 IntelliJ Idea 中运行单元测试没有任何问题但是当尝试从 SBT shell 运行相同的测试时我收到以下错误 java lang NoClassDefFoun
';'预期但发现“导入” - Scala 和 Spark

我正在尝试使用 Spark 和 Scala 来编译一个独立的应用程序我不知道为什么会收到此错误 topicModel scala 2 expected but import found error import org apache sp
Spark日期格式问题

我在火花日期格式中观察到奇怪的行为实际上我需要转换日期yy to yyyy 日期转换后日期应为 20yy 我尝试过如下 2040年后失败 import org apache spark sql functions val df Seq
HashPartitioner 是如何工作的？

我阅读了文档HashPartitioner http spark apache org docs 1 3 1 api java index html org apache spark HashPartitioner html 不幸的是除了
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
Spark SQL 失败，因为“常量池已超过 JVM 限制 0xFFFF”

我在 EMR 4 6 0 Spark 1 6 1 上运行此代码 val sqlContext SQLContext getOrCreate sc val inputRDD sqlContext read json input try inp
Spark 中的 Distinct() 函数如何工作？

我是 Apache Spark 的新手正在学习基本功能有一个小疑问假设我有一个元组键值的 RDD 并且想从中获取一些唯一的元组我使用distinct 函数我想知道该函数基于什么基础认为元组是不同的是基于键值还是两者 di
错误：无法找到或加载主类 org.apache.spark.launcher.Main [重复]

这个问题在这里已经有答案了如果有人能帮我解决以下路径问题我将不胜感激我非常怀疑这与缺少路径设置有关但不知道如何修复它 rxie ubuntu Downloads spark echo PATH usr bin java usr lo

随机推荐

/usr/bin/ld: 找不到 -lpthreads

我正在 Fedora 22 上编译 NVIDIA Caffe 工具但遇到问题需要查找lpthread图书馆 Determining if the pthread create exist failed with the following
如何更改R图表中的默认字体大小

我正在使用 R 包 cooccurr 无法弄清楚如何更改关联图形中的字体大小 par 方法似乎不起作用这是包中给出的示例 data finches cooccur finches lt cooccur mat finches type s
模块模式与匿名构造函数的实例

于是就有了这个所谓的模块模式用于创建具有私有成员的单例 var foo function var foo private return foo function console log foo bar public 还有这个方法是我自己找到
如何使用 click 来解析字符串中的参数？

假设我有一个包含参数和选项的字符串列表其中argparse 我可以使用以下方法解析这个列表parse args将函数转化为对象如下 import argparse extra params sum 7 1 42 parser argpa
如果中断 Git 推送会发生什么？

我运行了以下命令 git push u origin master 推送非常大文件很多所以上传需要时间中途我发现我忘记添加几个文件所以我做了 Ctrl C 在终端中断 Git 然后做完之后git add 我又承诺了然后又推了
DDD - 如何设计不同限界上下文之间的关联

我已经设置了一个正在使用 ORM 填充的域项目该域包含不同的聚合每个聚合都有自己的根对象我的问题是应该如何处理跨越聚合边界的属性这些属性是否应该简单地忽略边界以便有界上下文 A 中的域对象可以引用上下文 B 中的对象或者是否应
如何检查一次 UserDefaults 是否为空

我的应用程序计算日期和 NSDate 之间的天数当我发布它时用户只能保存一个日期一个标题和一张背景图像现在我有一个 UICollectionView 可以选择保存多个日期并且它将通过将日期标题和图像字符串附加到各自的数组来创建一
分叉进程的执行顺序

我知道还有另一个同名的线程但这实际上是一个不同的问题当一个进程多次分叉时父进程是否先于子进程完成执行反之亦然同时这是一个例子假设我有一个 for 循环将 1 个父进程分叉为 4 个子进程在 for 循环结束时我希望父进程
使用 Json.net 反序列化具有接口值的复杂嵌套字典类型

我在尝试使用 Json net 反序列化具有接口值的相当复杂的嵌套字典类型时遇到问题代码位于此处 https dotnetfiddle net JSoAug https dotnetfiddle net JSoAug 有问题的类型是 pu
python 我可以向 os.listdir 提供用户名和密码吗？

Python 3 4 Django 1 7 Windows Apache 2 4 12 我试图列出 Windows 共享驱动器上的所有文件仅限某些用户然后将几个文件写入共享驱动器我正在使用 os listdir 来执行此操作如果我只
如何使用 Selenium webdriver 在 Capybara 中打开新窗口？

我找到了一段代码 page driver browser switch to window 这显然是切换到已经打开的窗口我们如何使用 page driver browser 对象打开一个新窗口 Thanks 我最终来到这里即使是一个旧线
没有匹配的函数调用“pthread_create”

我正在使用 Xcode 和 C 制作一个简单的游戏问题是下面的代码 include
为什么在宏中使用明显无意义的 do-while 和 if-else 语句？

在许多 C C 宏中我看到宏的代码被包裹在看似毫无意义的内容中 do while环形以下是示例 define FOO X do f X g X while 0 define FOO X if 1 f X g X else 我看不到什么d
尽管身份密钥计数器在 TRY Catch 中且事务已回滚，但它仍会增加 1？ SSMS 2008

尽管身份计数器在 TRY Catch 中且事务已回滚但它仍会增加 1 SSMS 2008 有什么方法可以阻止它 1 或回滚它为了理解为什么会发生这种情况让我们首先执行下面的示例代码 USE tempdb CREATE TABLE db
将 Abaqus 宏转换为 Python 脚本

我正在使用 Abaqus 6 13 运行 FEM 热模拟我需要获得应用于该模型的总外部热通量我的搜索表明获得它的唯一方法是对整个模型的 RFLE 历史输出求和并且效果很好问题是我有大约 300 000 个元素模型并且简单打开 R
JSON 上的 PostgreSQL 索引

使用 Postgres9 4 我想在 json 列上创建一个索引该索引将在搜索列中的特定键时使用例如我有一个农场表其中包含 json 列动物 Animals 列具有通用格式的 json 对象 cow 2 chicken 11
如何在 grunt.initConfig() 之前执行异步操作？

现在我的 Gruntfile 设置可以执行一些自动检测魔法例如解析源文件以解析 roder 中的一些 PHP 源以动态找出运行前我需要知道的文件名和路径grunt initConfig 很遗憾grunt initConfig 似乎并不
jEditable：提交后显示选项文本（而不是值）

我在选择列表上使用 jEditable 除了以下问题之外它工作得很好 jEditable 在提交后显示服务器发回的任何内容这对于文本框等非常有用您可以在其中简单地从服务器发回提交的值然而这对选择列表没有意义因为发布的值只是选项元
如何知道 reCAPTCHA v3 是否有效？

我的前端使用 vuetify 如下 validate async function let tokenCaptcha await this recaptcha login then token gt tokenCaptcha token i
Spark 上的 MC-斯坦？

我希望使用MC Stan http mc stan org on Spark http spark apache org 但谷歌搜索似乎没有相关页面我想知道这种方法在 Spark 上是否可行因此如果有人让我知道我将不胜感激此外我还

Spark 上的 MC-斯坦？

Spark 上的 MC-斯坦？ 的相关文章

随机推荐

热门标签

Spark 上的 MC-斯坦？的相关文章