为什么对本地列表求和比用“GHC -O2”对教会编码列表求和慢？

2024-06-01

为了测试教会编码的列表如何针对用户定义的列表和本机列表执行，我准备了 3 个基准测试：

用户定义的列表

data List a = Cons a (List a) | Nil deriving Show
lenumTil n        = go n Nil where
    go 0 result   = result
    go n result   = go (n-1) (Cons (n-1) result)
lsum Nil          = 0
lsum (Cons h t)   = h + (lsum t)

main = print (lsum (lenumTil (100000000 :: Int)))

本地列表

main = print $ sum ([0..100000000-1] :: [Int])

教会名单

fsum   = (\ a -> (a (+) 0))
fenumTil n cons nil = go n nil where
    go 0 result    = result
    go n result    = go (n-1) (cons (n-1) result)
main = print $ (fsum (fenumTil (100000000 :: Int)) :: Int)

基准测试结果出乎意料：

用户定义的列表

-- 4999999950000000
-- real 0m22.520s
-- user 0m59.815s
-- sys  0m20.327s

本地列表

-- 4999999950000000
-- real 0m0.999s
-- user 0m1.357s
-- sys  0m0.252s

教会名单

-- 4999999950000000
-- real 0m0.010s
-- user 0m0.002s
-- sys  0m0.003s

人们会期望，通过针对本机列表的大量特定优化，它们将表现最佳。然而，教会列表的表现比它们高出 100 倍，比用户定义的 ADT 高出 2250 倍。我已经编译了所有程序GHC -O2。我尝试过更换sum by foldl'，结果相同。我尝试添加用户输入以确保教堂列表版本没有优化为常量。arkeet在 #haskell 上指出，通过检查 Core，原生版本有一个中间列表，但为什么呢？强制分配额外的reverse，所有 3 个的性能大致相同。

GHC 7.10 有调用数量 http://www.joachim-breitner.de/publications/CallArity-TFP.pdf分析，让我们定义foldl按照foldr从而让左边的折叠，包括sum，参与融合。 GHC 7.8 还定义了sum with foldl但它无法将列表融合掉。因此，GHC 7.10 的性能最佳且与 Church 版本相同。

Church 版本在任一 GHC 版本中进行优化都是轻而易举的事情。我们只需要内联(+) and 0 into fenumTil，然后我们就有了一个明显的尾递归go它可以很容易地拆箱，然后由代码生成器转换为循环。

用户定义的版本不是尾递归的，它在线性空间中工作，这当然会破坏性能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Algorithm

performance

list

Haskell

为什么对本地列表求和比用“GHC -O2”对教会编码列表求和慢？的相关文章

哪个 SQL 语句更快？（有与在哪里......）

SELECT NR DZIALU COUNT NR DZIALU AS LICZ PRAC DZIALU FROM PRACOWNICY GROUP BY NR DZIALU HAVING NR DZIALU 30 or SELECT NR
加速结构化 NumPy 数组

NumPy数组在性能和易用性方面都非常出色比列表更容易切片索引我尝试构建一个数据容器NumPy structured array代替dict of NumPy arrays 问题是性能要差得多使用同质数据的情况大约是 2 5 倍而
如何构图“也许”镜头？

如果我有嵌套记录的镜头其中每个镜头返回一个Maybe 我怎样才能让它们组合起来这样如果遍历中有任何东西返回一个Nothing最终结果是Nothing data Client Client clientProperties Maybe
将整数转换为其 ascii 值的字符串

给定一个数字number这样它的数字被分组为长度的部分n 默认值为n是3 其中每个组代表一些ascii值我想转换number转换为这些 ASCII 字符的字符串例如 n number Output 3 70 F 3 6506606606
从 SQL 数据库反序列化数据

我有一个小应用程序由数据库支持 SQLite 但它与问题并不真正相关我定义了一些类型例如 data Whatever Whatever Int Int String String data ImportantStuff Importa
Haskell：打印文本编码

Haskell 新手在这里 ghc version The Glorious Glasgow Haskell Compilation System version 6 12 1 在尝试调试第三方 Haskell 程序中与区域设置相关的奇怪错
Java try/catch 性能，是否建议将 try 子句中的内容保持在最低限度？

考虑到您有这样的代码 doSomething this method may throw a checked a exception do some assignements calculations doAnotherThing this
通过位屏蔽查找数据间隙

我面临着在数字序列中查找给定长度的不连续性间隙的问题因此例如给定 1 2 3 7 8 9 10 和一个间隙length 3 我会找到 4 5 6 如果间隙是length 4 我什么也找不到当然真正的序列要长得多我在很多帖子中
快速将每秒一个字节复制到新的内存区域

我需要一种快速方法将每个第二个字节复制到新的 malloc 内存区域我有一个包含 RGB 数据且每通道 16 位 48 位的原始图像并且想要创建每通道 8 位 24 位的 RGB 图像有没有比按字节复制更快的方法我对SSE2了解
有没有办法加快此 VBA 宏的运行速度，以在大范围内执行 1000 次 Vlookup？

Sub Questionnaire to Ventilation Questionnaire to Ventilation Macro Keyboard Shortcut Ctrl Shift M Application ScreenUpd
如何在 C# 中将二维数组转换为二维列表

我有一个二维字符串数组我想把它转换成 List
Neo4j 超级节点问题 - 扇出模式

我是图形数据库场景的新手正在研究 Neo4j 并学习 Cypher 我们正在尝试对图形数据库进行建模这是一个相当简单的数据库我们得到了users 我们得到了movies users can VIEW movies RATE movie
当测试文件定义为模块时，使用堆栈调用 hspec 定义的测试会抛出错误

我试图弄清楚为什么包含定义为模块的单元测试的测试文件在运行时失败stack build test 假设有一个从头开始定义的简单测试模块 stack new test module cd test module vim package yam
遍历后加快数组查找速度？

我有一个123MB大的int数组它基本上是这样使用的 private static int data new int 32487834 static int eval int c int p data c 0 p data p c 1 p
MapReduce 只是另一个编程原理的概括吗？

我正在研究并行编程并且正在研究映射缩减和其他分布式算法最好只学习mapreduce 还是有更通用的算法可以更好地为我服务这取决于您打算使用算法的目的映射减少 http labs google com papers mapreduce
如何指定内联类型中使用的类型变量与函数定义中使用的类型变量相同？

如果我的术语有误请道歉我正在尝试编写一个处理异常的包装函数如果给定IO动作抛出它返回Nothing 在一个IO当然是上下文但是如果给定IO操作成功返回Just v tryMaybe IO a gt IO Maybe a tryM
加入列表中除最后 x 之外的所有内容

我有一个列表想要加入除最后 2 个条目之外的所有条目 IE x 1 2 3 4 print join x from 0 until 3 那么输出将是1 2 我怎样才能做到这一点 Use slicing https docs python
“引用透明”IO 调用的可重入缓存

假设我们有一个 IO 操作例如 lookupStuff InputType gt IO OutputType 这可能是一些简单的事情例如 DNS 查找或者针对时不变数据的某些 Web 服务调用我们假设该操作永远不会抛出任何异常和
两个sql查询的性能差异？

我的表中有一个具有文本数据类型的字段以下两个sql查询的性能是否有差异 select from tablename where fieldname xyz select from tablename where fieldname zyx
如何在haskell快速傅里叶变换上应用数据并行？

我有一个 haskell 代码来解决快速傅里叶变换并且我想对其应用数据并行性然而我使用的每一个策略都会产生太多的火花而且大多数都溢出了有谁知道如何在以下算法上应用良好的数据并行策略 radix 2 Cooley Tukey FFT

随机推荐

嵌入式开发系统中JTAG的一般工作流程？

在我的嵌入式项目中我使用 JTAG 接口下载代码并调试下载的应用程序但我不知道 JTAG 设置内部发生了什么任何人都可以给我 JTAG 设置的基本想法流程高级视图这将真正帮助我更好地理解我的开发系统为了添加克利福德的答案这里
如何用js获取一个月的4个星期一？

我正在构建一个图表其中 x 轴应该是一个月的四个星期我只想显示该月的四个星期一我已经有了currentMonth和currentYear变量而且我知道如何获取该月的第一天我所需要的只是将一个月的四个星期一放入数组中所有这些都在同
Django 评论和评级系统

我正在寻找一个可以与我的 Django 网站顺利集成的博客和评论系统我在网上发现了很多但有点迷失了我在这方面没有太多经验希望大家能给我一些建议以下是我想要拥有的东西标签云文章存档按月按年文章评级例如带有星星或自定义图标
MVC4 输入字段占位符

Does MVC4默认支持placeholders对于生成的输入字段我没有找到任何东西所以我正在尝试实现我自己的但不幸的是Prompt E Mail 没有传递到ViewData ModelMetadata Watermark同时产生控
在cameraX中镜像

如何在前置和后置摄像头模式下显示镜像我知道这个位图可以像下面一样镜像 BitmapDrawable flip BitmapDrawable d Matrix m new Matrix m preScale 1 1 Bitmap src d
CSS 无法与 CodeIgniter 一起使用

这是我的 CI 代码的一部分 class page extends CI Controller var Page public function construct parent construct this gt Page 1 this
访问自定义表单控件的有效值

我创建了代表密码表单控件的自定义组件下面的代码已简化密码组件 html
从 Orbeon XForm 提交发送 HTTP 标头

我有一个 API 它依赖于某些 HTTP 标头来实现特定行为示例是 HTTP 标头If Matches仅当版本与值匹配时才支持更新If Matches 我如何从 Orbeon XForms 提交发送这些 HTTP 标头 The xf su
C# 线程和队列

这不是关于我可以或应该使用的不同方法来以最佳方式利用队列而是关于我所看到的对我来说毫无意义的事情 void Runner member variable queue Queue Synchronized new Queue while t
带滚动条的 HTML 画布

我正在宽度不等的画布上绘制图表每个画布可以有自己的滚动条吗我尝试将所有画布放在一个 div 中并指定最大宽度但它不起作用是否有可能所有画布在页面上的可见宽度均为 500 像素并且每个画布都有其滚动条来查看画布的整个宽度谢谢指定
Matlab 中的多行匿名函数？ [复制]

这个问题在这里已经有答案了是否可以在 Matlab 中创建多行匿名函数没有合适的例子在文档中 http www mathworks com help matlab matlab prog anonymous functions html
撤消多个文件和文件夹“git add”[重复]

这个问题在这里已经有答案了我执行了 git add 现在我想恢复 git add 我怎样才能做到这一点 git reset 这相当于git reset HEAD 将取消 add 更常见的是取消暂存所有文件 In Git revert用
使用 Junit5 对 LiveDataobserverForever 进行单元测试会导致 NullPointer 异常

我正在使用 Android 数据绑定来监听实时数据更改并且我想观察视图模型级别的更改而不是观察片段然后向视图模型发送回调这observerForever很有趣因为它对我有用但是当我运行测试时出现以下错误 java lang
调整窗口大小后保持 winform 控件居中

使用 Visual Studio 2008 Windows 窗体 C NET 2 0 是否有一种无代码的方法来使控件在我的例子中恰好是 PictureBox 在调整窗口大小时保持居中换句话说使用属性设置的某种组合而不是手动编写代码来保
如何自动执行使用 Maven 构建的 Eclipse 插件的版本号更新过程

我正在处理一个与该项目类似的项目此处描述 http www vogella com articles EclipseTycho article html 因此它在父 pom xml 中有一些模块
viewportFraction < 1.0 的 PageView 非中心对齐

当您为 PageController 创建 viewportFraction 值为我希望当前页面捕捉到视口的顶部而下一页呈现在底部栏下方我尝试对每个页面应用转换 Transform translate offset Offset 0
使用 HttpClient 从 webapi 消费 xml

我使用 WebClient 从 Restfull 服务 net web api 获取 Xml 对象一切都运行良好 using WebClient client new WebClient client Encoding UTF8Encod
调整离子卡中的图像大小

我想显示一组图像并在下面说明我选择使用 Ionic 卡我得到这个结果第一张图片虽然我想保留现在的相同布局并添加描述这是我的代码
嵌套字段索引

我正在尝试使用 AWS 开发人员控制台中的仪表板在嵌套字段上创建索引例如如果我有以下架构 id 1 nested mode mode1 text nice text 我能够创建索引nested mode 但是每当我通过索引进行查询时就
为什么对本地列表求和比用“GHC -O2”对教会编码列表求和慢？

为了测试教会编码的列表如何针对用户定义的列表和本机列表执行我准备了 3 个基准测试用户定义的列表 data List a Cons a List a Nil deriving Show lenumTil n go n Nil where

热门标签