Haskell 中的多核编程 - Control.Parallel

2024-01-05

我正在尝试学习如何使用Control.Parallel模块，但我认为我没有理解正确。

我正在尝试运行以下代码（fibs.hs).

import Control.Parallel

fib :: Int -> Int
fib 0 = 0
fib 1 = 1
fib n = p `par` (q `pseq`  (p + q))
    where
      p = fib (n-1)
      q = fib (n-2)


main = print $ fib 30

我用以下方法编译了这个：

ghc -O2 --make -threaded fibs.hs

然后执行该程序得到以下结果（Python 脚本的输出，该脚本运行每个程序 100 次并返回执行时间的平均值和标准差）：

./fibs +RTS -N1 -> avg= 0.060203 s, deviation = 0.004112 s  
./fibs +RTS -N2 -> avg= 0.052335 s, deviation = 0.006713 s  
./fibs +RTS -N3 -> avg= 0.052935 s, deviation = 0.006183 s  
./fibs +RTS -N4 -> avg= 0.053976 s, deviation = 0.007106 s  
./fibs +RTS -N5 -> avg= 0.055227 s, deviation = 0.008598 s  
./fibs +RTS -N6 -> avg= 0.055703 s, deviation = 0.006537 s  
./fibs +RTS -N7 -> avg= 0.058327 s, deviation = 0.007526 s

我的问题是：

当我评估时到底发生了什么：
```
a `par` (b `pseq` (a + b))   ?
```
我明白，一个parb 应该提示编译器与 b 并行计算 a 并返回 b。好的。但有什么作用pseq do?
为什么我看到的性能提升如此之小？我在英特尔上运行这个Core 2 http://en.wikipedia.org/wiki/Intel_Core_2四机.我预计使用 -N5 或 -N6 运行不会对性能产生真正的影响，或者程序实际上会开始表现得非常糟糕。但为什么我没有看到从 -N2 到 -N3 的任何改进，并且为什么最初的改进如此之小？

As Don 解释了 https://stackoverflow.com/questions/1798996/multicore-programming-in-haskell-control-parallel/1799134#1799134，问题是你制造了太多的火花。以下是您可以如何重写它以获得良好的加速效果。

import Control.Parallel

cutoff :: Int
cutoff = 20

parFib :: Int -> Int
parFib n | n < cutoff = fib n
parFib n = p `par` q `pseq` (p + q)
    where
      p = parFib $ n - 1
      q = parFib $ n - 2

fib :: Int -> Int
fib 0 = 0
fib 1 = 1
fib n = fib (n - 1) + fib (n - 2)

main :: IO ()
main = print $ parFib 40

示范：

[computer ~]$ ghc --make -threaded -O2 Main.hs
[1 of 1] Compiling Main             ( Main.hs, Main.o )
Linking Main ...
[computer ~]$ time ./Main +RTS -N1
102334155

real    0m1.509s
user    0m1.450s
sys     0m0.003s
[computer ~]$ time ./Main +RTS -N2
102334155

real    0m0.776s
user    0m1.487s
sys     0m0.023s
[computer ~]$ time ./Main +RTS -N3
102334155

real    0m0.564s
user    0m1.487s
sys     0m0.030s
[computer ~]$ time ./Main +RTS -N4
102334155

real    0m0.510s
user    0m1.587s
sys     0m0.047s
[computer ~]$

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Multithreading

Haskell

parallelprocessing

multicore

Haskell 中的多核编程 - Control.Parallel 的相关文章

如何使用 Python 从 Azure Functions 中的辅助线程重定向日志

我正在使用 Azure 函数运行启动多个线程的 Python 脚本出于性能原因一切都按预期工作但 Azure Functions 日志中仅显示来自 main 线程的信息日志我在 main 中启动的辅助线程中使用的所有日志都不会出
在Java中，如何在每次进入或退出给定对象的监视器时记录一条消息？

我正在尝试调试一些使用一些自定义引用计数锁定的 C Java 绑定我想让 JVM 在每次给定对象进入或退出其监视器时打印一条消息有什么办法可以做到这一点吗基本上我想要这个 synchronized lock System out
编写潜在并发问题的证明

我正在阅读 Java 并发实践并尝试编写一段代码来表明第 3 5 1 章中作为示例提供的类确实会引入问题 public class Holder public int n public Holder int n this n n publ
是否值得清理 Filter 中的 ThreadLocals 来解决线程池相关问题？

简而言之 tomcat 使用线程池因此线程被重用一些图书馆使用ThreadLocal变量但不要清理它们使用 remove 所以实际上它们将脏线程返回到池中 Tomcat 具有在关闭时检测这些事情并清理线程局部变量的新功能但这意
非法监控状态异常

如何将轮询线程传递给另一个线程进行处理程序执行在控制器类中该类具有 main 方法和线程池主类控制器 public static void main String args throws InterruptedException Ru
Haskell，optparse-generic 的未命名命令行参数

我在用着optparse 通用 https hackage haskell org package optparse generic解析名为的程序的命令行参数example 我有一个带有命名字段的数据类型记录语法例如 data Exam
JMeter：tearDown Thread Group的目的是什么

我想了解JMeter中tearDown Thread Group的实际用法在什么场景下可以使用tearDown Thread Group 根据提供的帮助JMeter 拆解线程组 http jmeter apache org userman
使用 theano 进行多处理

我正在尝试将 theano 与 cpu 多处理和神经网络库 Keras 结合使用 I use device gpu标记并加载 keras 模型然后为了提取超过一百万张图像的特征我使用多处理池该函数看起来像这样 from keras
如何管理循环器和线程（线程不再消亡！）

我创建了一个扩展 Thread 的类以通过非 ui 线程中的 LocationManager 检索用户位置我将其实现为一个线程因为它必须根据请求启动并仅在有限的时间内完成其工作顺便说一句我必须在线程中添加一个 Looper 对象
跟踪 pthread 调度

我想做的是创建某种图表详细说明 Linux 中两个线程的执行情况我不需要查看线程的作用只需查看它们何时被安排以及持续多长时间基本上是一条时间线在过去的几个小时里我一直在互联网上搜索跟踪 pthread 调度的方法不幸的是
生成所有可能的树

给定以下数据类型定义 data FormTree Empty Node FormTree FormTree deriving Show 我想编写一个函数它生成一个无限列表其中包含按长度排序的所有可能的树例如节点数量下面的代码几乎满足
整数转浮点数

这段代码的工作原理 posToXY Float gt Float gt Integer posToXY a b do let y a b round y 但这不起作用 posToXY Integer gt Integer gt Intege
Socket.*Async 方法是线程化的吗？

我目前正在尝试找出最小化 TCP 主服务器中使用的线程数量的最佳方法以便最大限度地提高性能由于我最近阅读了大量 C 5 0 的新异步功能异步并不一定意味着多线程这可能意味着将有限状态对象分成较小的块然后通过交替与其他操作一起进行处
WaitForSingleObject 是否充当内存屏障？

昨天一个关于双重检查锁定的问题引发了一系列的想法让我对一个简单的情况感到不确定在下面的代码中是否可以点击printf 不再同步在这个简单的示例中这些值可能位于同一缓存行上因此我认为这种可能性较小假设一开始可能性 gt 0 如果
导入 Haskell 模块

我是哈斯克尔的新手为什么当我尝试使用时Days from Data Time我收到此错误 Could not find module Data Time It is a member of the hidden package time
块执行后变量返回 null

我正在调度一个队列来在单独的线程上下载一些 flickr 照片在 viewWillAppear 中当我记录块内数组的内容时它完美地显示了所有内容 dispatch queue t photoDowonload dispatch que
Python time.sleep - 永不醒来

我认为这将是那些简单的问题之一但它让我感到困惑停止媒体我是对的找到了解决方案查看答案我正在使用 Python 的单元测试框架来测试多线程应用程序很好而且很直接我有 5 个左右的工作线程监视一个公共队列以及一个为它们制作工作
这个记忆的斐波那契函数是如何工作的？

在我正在做的函数式编程课程的当前练习作业中我们必须制作给定函数的记忆版本为了解释记忆化给出以下示例 fiblist fibm x x lt 0 fibm 0 0 fibm 1 1 fibm n fiblist n 1 fiblist
将数据类型设置为 Kind * -> * 这不是函子

布伦特约尔吉类型分类百科全书 https www haskell org haskellwiki Typeclassopedia给出以下练习举一个类型的例子 gt 不能将其制成的实例Functor 不使用undefined 请告诉我什
在特定线程上运行工作

我想要一个特定的线程任务队列并在该单独的线程中处理任务应用程序将根据用户的使用情况创建任务并将其排队到任务队列中然后单独的线程处理任务即使队列为空保持线程活动并使用它来处理排队任务也至关重要我尝试过几种实现TaskSchedul

随机推荐

在Python中使用Popen执行Powershell脚本，如何获取Powershell脚本的输出并将其更新到网页？

我创建了一个带有按钮的简单 HTML 当用户单击该按钮时它将调用在服务器端执行的Python文件在Python文件中我使用Popen调用Powershell脚本如下代码 command line r C WINDOWS system
在Python中组合模块文件

有没有一种方法可以将 Python 文件组合在一起类似于 Java 中的 JAR 我需要一种打包 Python 类和函数集的方法但与标准模块不同我希望它位于一个文件中在寻找同一问题的解决方案后我最终编写了一个简单的工具它将多个
如何从Flash加载flex swf？

我有一些在 Flex 中编译的 swf 我想将其加载到 flash pro 中的影片剪辑中那么如何在 Flash CS4 中加载 flex swf 呢怎么做这样的事情您可以在这里阅读更多相关信息 http troygilbert co
Cakephp 路由前缀

我的应用程序有 3 种不同的布局与内容的不同部分相关我想定义我的 url s 以便他们在开头的 ex 中包含该部分 mypage com part1 controller 我不知道如何改变路线来实现这一点附我不想要普通的前缀路由其
如何在日志文件名中的文件扩展名之前附加滚动索引

我正在使用RollingLogFileAppender它工作得很好并且正在滚动到新文件中但它在文件的最后添加了 1 2 等所以我最终得到 log 1 log 2等等所以从技术上讲每个文件都有一个资源管理器不知道的新扩展名所以我不能
scanf 不超过缓冲区溢出

我有一个缓冲区我不希望用户输入的字符多于缓冲区可以容纳的字符以避免缓冲区溢出我在用scanf并做了这样的事情 char buffer 30 0 scanf 30s buffer 但是我知道如果用户输入超过 30 个我会受到保护但
用户空间和内核线程之间的共享内存

我正在开发一个涉及 kthreads 的内核应用程序我创建一个结构数组并在用户空间中使用 malloc 分配内存然后我调用系统调用我实现的并将数组的地址传递到内核空间在我创建的系统调用处理程序中我创建了 2 个 kthreads
使用分组依据和按日期排序的 SQL 选择

我正在使用 SQL Server 2008 我想知道是否可以在一个 select 语句中完成我的查询而无需子查询如果记录中的字段在最近 10 个创建的记录中为 true 我想将变量设置为 true 如果该字段在最后 10 个记录中为 t
Google GData .Net OAuthUtil.GetAccessToken 400 错误请求

我正在尝试通过 Google Net GData 客户端库生成 OAuth 访问令牌我一直在使用中的说明http code google com apis gdata docs auth oauth html http code goog
在数据库中使用DXL导入SSJS脚本库

我们需要使用 DXL 在数据库中导入 SSJS 库为此我们编写了一个 Java 代理其代码如下 import lotus domino public class JavaAgent extends AgentBase private
堆栈不足以继续安全地执行程序。 ASP.NET MVC 4

我的搜索功能似乎在无限循环中继续每次我的调试命中 POST actionresult 下面的操作时都会被触发在我的 Masterpage cshtml 中我有以下操作 li Html Action Search Search li 这
递归删除数组键前缀

我有一个以下格式的数组每个子数组都以父级的键作为前缀 input array seo text gt array seo text title gt seo text description gt seo text button gt a
一键上传文件

如何在需要发送文件的 html 中制作一个按钮允许您选择文件然后将其发送到我想要的页面上而不使用按钮来选择文件并使用按钮将其发送到另一个页面感谢您
python3.6 - TypeError：write() 参数必须是 str，而不是 bytes - 但不涉及文件

以下代码返回错误我不明白为什么在Python 3 6上运行 import subprocess import sys import os def execute shell cmd cmd process subprocess Pope
Qt 上的“GLib-ERROR **：无法创建管道主循环唤醒：打开的文件太多”

我正在 Ubuntu 上工作当我运行程序大约 1 小时后我收到此错误 GLib ERROR 无法创建管道主循环唤醒打开的文件太多程序意外完成当我使用 gdb 运行时它不会崩溃我不明白为什么以及此错误的原因是什么非常感谢打开
后台模式下的 iOS 区域监控

我在我的应用程序中使用区域监控但遇到了一个问题但找不到任何答案区域监控在后台模式下如何工作根据位置感知 PG 的说法每次用户的当前位置跨越边界区域系统生成适当的区域事件为您的应用程序如果你的应用程序已经在运行这些活
寻找一个 Perl 模块来在共享 RAM 中存储哈希结构

我想将数据结构持久存储在 RAM 中并可以从预分叉中访问它 Perl 中的 Web 服务器进程理想情况下我希望它的行为类似于 memcached 但不需要单独的守护进程有任何想法吗 Use 缓存 FastMmap http sear
定义中的预处理器指令？ [复制]

这个问题在这里已经有答案了可能的重复 C 预处理器在 define 中使用 if https stackoverflow com questions 2831934 c preprocessor using if inside defi
检测零分和交叉中获胜的比赛

我需要知道在圈和十字游戏中检测获胜动作的最佳方法源代码并不重要我只需要一个示例或可以开始的东西我唯一能想到的就是使用循环并测试玩家所做的每个动作的每个方向以搜索例如连续五个有没有更快更有效的方法呢真正简单的解决方案是从最后一步开
Haskell 中的多核编程 - Control.Parallel

我正在尝试学习如何使用Control Parallel模块但我认为我没有理解正确我正在尝试运行以下代码 fibs hs import Control Parallel fib Int gt Int fib 0 0 fib 1 1 fib

Haskell 中的多核编程 - Control.Parallel

Haskell 中的多核编程 - Control.Parallel 的相关文章

随机推荐

热门标签