LLVM 尾调用优化

2024-04-28

以下是我对事情的理解：

当函数“f”调用自身是其最后一个动作时，它是尾递归的。通过形成循环而不是再次调用函数，可以显着优化尾递归；函数的参数已就地更新，并且函数体再次运行。这称为递归尾调用优化。

LLVM 在使用 fastcc、GHC 或 HiPE 调用约定时实现递归尾部调用优化。http://llvm.org/docs/CodeGenerator.html#tail-call-optimization http://llvm.org/docs/CodeGenerator.html#tail-call-optimization

我有一些疑问：让我们考虑一个愚蠢的例子：

int h(int x){
  if (x <= 0)
    return x;
  else
    h(x-1);
}

1）在他们的示例中，关键字“tail”位于调用之前。我在其他地方读到这个关键字是可选的。假设上面的函数被适当地翻译为 LLVM，最后几行是否需要

%x' = load *i32 %x
%m = tail call fastcc i32 @h(i32 %x')
ret %m

2）示例中 inreg 选项的含义是什么？

3）我不想到处执行尾调用优化，只针对递归函数。有没有办法让 LLVM 只对递归函数执行优化（如果可用）？

显然答案是肯定的。你必须改变 h 的定义才能看到这一点（因为优化器太好了！它会计算出 h 要么是恒等式，要么返回 0）。

Consider

int factorial (int x, int y){
  if (x==0)
    return y;
  else
    return factorial(x-1,y*x);
}

使用 clang -S -emit-llvm 编译，因此不执行任何优化。人们看到没有直接指定调用约定，这意味着默认的调用约定足以支持尾递归优化（通常是否支持尾调用是另一回事——知道这一点会很有趣，但我想这确实是一个不同的问题）。

clang -S -emit-llvm 发出的文件是 main.s （假设阶乘定义在 main.c 中）。如果你跑

opt -O3 main.s -S -o mainOpt.s

然后你可以看到尾递归被消除了。有一个称为 tailcallelim 的优化，可以作为 -O3 打开。这很难说，因为帮助文件 opt --help 只说 -O3 与 gcc -O3 类似。

关键是我们可以看到不需要为此指定调用约定。也许不需要 fastcc，或者它是默认的？所以（1）得到了部分回答；但是，我仍然不知道（2）或（3）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LLVM 尾调用优化的相关文章

使用 llvm-prof 收集 LLVM 边缘分析

我正在使用这些命令来编译下面的代码以收集 trunk llvm 中的边缘块分析 clang emit llvm c sort c o sort bc opt insert edge profiling sort bc o sort pro
有 libclang 的教程吗？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我一直在寻找一些易于理解的 libclang 指南我在这里或其他论坛上看到了一些帖子但唯一推荐的信
使用 Emscripten 导出所有函数

我想通过 JavaScript 以简单的方式使用 C 源代码仅使用免费自由软件所以 Emscripten 似乎是一个不错的选择 https kripken github io emscripten site docs porting
可以从 LLVM-IR 自动生成 llvm c++ api 代码吗？

clang 3 0 在线演示页面http llvm org demo index cgi http llvm org demo index cgi提供输出 LLVM C API 代码的选项表示输入程序的 LLVM IR 生成 LLVM C
在 llvm 上运行 x86 程序

是否可以使用llvm来运行x86程序 IE 我想使用 llvm 作为 x86 模拟器来运行 x86 程序然后对 x86 程序进行检测 Thanks 我想你正在寻找LibCPU http LibCPU Org It has x86 前端 h
LLVM 的 amd64 输出中向量的对齐

我正在尝试通过 LLVM 在结构内部使用向量我的结构有以下 C 定义 struct Foo uint32 t len uint32 t data 32 attribute aligned 16 下面是一些 LLVM 代码用于将 42 添
什么推理导致“包含递归定义的序列表达式编译不正确”

问题尽管尾调用位置存在堆栈溢出但仅限 64 位 https stackoverflow com q 35751350 1243762导致发现一个bug https github com Microsoft visualfsharp iss
这里使用尾递归有什么好处？

我一直在阅读描述如何通过使用尾递归版本来降低快速排序的空间复杂度的文章但我无法理解这是怎么回事以下是两个版本 QUICKSORT A p r q PARTITION A p r QUICKSORT A p q 1 QUICKSORT A
如何创建一个尾递归方法，该方法也可以以非尾递归方式引用自身

假设我有一种用于长时间运行的计算的机制可以暂停自己以便稍后恢复 sealed trait LongRunning R case class Result R result R extends LongRunning R case clas
LLVM环境变量在哪里或者LLVM环境是如何配置的？

作为上下文我有一台 Mac 我在工作中使用它使用各种自定义构建脚本进行开发我现在尝试使用同一台机器来玩一些个人 Xcode 项目第一步我在 Xcode 11 3 1 中创建一个新的 Single View App 项目并尝试在我连
有谁能够在 iOS 上使用 Address-Sanitizer（称为 asan 或 -fsanitize=address）吗？

地址消毒剂https code google com p address sanitizer wiki AddressSanitizer https code google com p address sanitizer wiki Addr
构建 LLVM 失败并显示空错误消息

我正在尝试构建 LLVM 3 1 和 Clang 3 1 我遵循了入门指南铿锵的网站 http clang llvm org get started html 检查必要位置的存储库获取 Python 等如果我安装了 Python 3 3
如何从 LLVM 的中间表示中获取程序每个函数中执行的函数调用列表？

我正在尝试使用 LLVM 构建一个简单版本的代码分析工具我有一些 ll 文件其中包含某些程序的中间 LLVM 表示如何从 LLVM 的中间表示中获取程序每个函数中执行的函数调用列表我的输入参数是 LLVM Module 类的一个实例
使用 LLVM 内联特定函数调用

给定一个llvm CallInst 我如何告诉内联器内联这个特定的调用我可以将目标函数标记为AlwaysInline这将内联调用但它也会内联每个调用也许有某种方法可以在我发出特定调用时调用内联函数内联基本块内的所有调用也可以您可以
在 Prolog、尾递归中计算斐波那契数列

我想在 Prolog 中以递归尾部模式计算斐波那契数列 fibonacci 0 0 fibonacci 1 1 fibonacci N Result fibonacci N 1 0 fibonacci N Result Count Coun
识别 IR 中的阵列类型

我一直在尝试使用以下代码来识别 IR 中的数组访问 for BasicBlock iterator ii BB gt begin ii2 ii BB gt end ii Instruction I ii if GetElementPtrIn
C++11 的 LLVM&Clang 支持

我有一些为 MS VC 10 编写的代码我使用 C 11 特别是像这样的表达式 std function
链接 llvm 库

我正在开发一个基于 llvm 的编译器当我尝试生成可执行文件时会发生以下错误 bin llvmcode s 35 对 operator new unsigned long 的未定义引用请注意在生成的 IR 中调用了位于 llvm
通过 cmake 链接 libc++ 时 libc++abi 的链接问题

我正在尝试构建一个简单的 hello world C 使用 LLVM Clang 3 7 0 的程序根据工具链的源代码构建libc 使用命令行 clang std c 14 stdlib libc fno exceptions hello
如何在Scala中实现尾递归快速排序

我写了一个递归版本 def quickSort T xs List T p T T gt Boolean List T xs match case Nil gt Nil case gt val x xs head val left righ

随机推荐

无需重新计算即可获取字典键哈希

有没有办法从字典中提取现有的密钥哈希而无需再次重新计算它们暴露它们并因此通过哈希而不是密钥访问字典会有什么风险我认为 Python 的字典对象没有任何公共 API 可以让您查看存储其对象的哈希值您无法在 Python 代码中直接通过
Scala 恢复或recoverWith

我们公司正在用Scala开发一些系统我们有一些疑问我们正在讨论如何映射未来的异常但我们不知道何时应该使用选项 1 或选项 2 val created Future 选项1 val a created recover case e da
具有运行空间池的 SessionStateProxy 变量

我想在 PowerShell 中使用运行空间池来执行后台操作但我需要从主线程访问 WPF 窗口变量普通运行空间有以下选项 runspace SessionStateProxy SetVariable xamGUI xamGUI 但是我如
内容更改时 DataGridView 样式不更新

好的这是我的情况我有一个DataGridView含有Messages 应用以下样式
计算具有不均匀间隔点的 3D 梯度

我目前有一个由几百万个不均匀间隔的粒子组成的体积每个粒子都有一个属性对于那些好奇的人来说是潜力我想计算其局部力加速度 np gradient 仅适用于均匀分布的数据我在这里查看 numpy 中的二阶梯度 https stackov
Python 和 Scipy：如何拟合冯·米塞斯分布？

我正在尝试拟合来自 scipy 的冯米塞斯分布 http docs scipy org doc scipy reference generated scipy stats vonmises html http docs scipy org
ValueError：无法解释优化器标识符：

我尝试运行此代码但出现此错误请任何人过去也遇到过相同的错误 sgd optimizers SGD lr 0 01 decay 1e 6 momentum 0 9 nesterov True 编译模型 model compile opti
IE 中“对象不支持属性或方法‘查找’”
如何在java中将ojalgo稀疏数组存储到文件中？

我目前有一个 SparseStore 矩阵我在其中执行大量计数和计算我想将其存储到文件中以便以后可以重复使用它而无需重新执行之前的所有计算我尝试了 Java 中的基本序列化 ObjectOutputStream outputStr
滚动文件实现

我一直很好奇滚动文件是如何在日志中实现的如何开始用任何语言创建一个文件写入类以确保不超过文件大小我能想到的唯一可能的解决方案是 write method size file size size of string to write i
python 正则表达式 - 列表中的 re.findall()

这是我的清单 lista u REG S 3 UMTS 0 0 RNC u REG S 3 UMTS 0 1 RNC u REG S 3 UMTS 0 2 RNC u REG S 2 GSM NORT CBSP bsc 0 0 BSC u
无法从 JAR 文件加载主类

我有一个 Spark scala 应用程序我尝试显示一条简单的消息 Hello my App 当我编译它时sbt compile并运行它sbt run没关系我成功显示了我的消息但他显示了错误像这样 Hello my applicat
在 ant 脚本中包含外部 JAR 时出错

这是我第一次尝试编写 ANT 脚本这是我使用 Spring 构建的简单 Hello World 应用程序的 build xml
如何找到具有特定字符串但不在注释中的代码

我试图在 1 000 个存储过程和函数中搜索特定字符串在本例中为电子邮件地址但当它位于注释块中时我想忽略它这是查找对象的 SQL 语法但有数百个结果我不想遍历每个结果来确定电子邮件地址是在代码中使用还是仅在注释块中使用 SELEC
MySQL ORDER BY rand()，名称 ASC

我想获取一个包含 1000 个用户的数据库并随机选择 20 个用户 ORDER BY rand LIMIT 20 然后按名称对结果集进行排序我想出了以下查询not像我希望的那样工作 SELECT FROM users WHERE 1 OR
使用 Excel 从 Lotus Notes 发送电子邮件并具有附件和 HTML 正文

是的我正在尝试通过 Lotus Notes 发送 Excel 电子表格的电子邮件它有一个附件并且正文需要采用 HTML 格式从我读过的所有代码来看我有一些代码应该允许我这样做但事实并非如此如果没有 HTML 正文附件将发送
如何从电子表格加载特定工作表

我有一个包含很多工作表的电子表格我需要加载其中一张工作表我该怎么做 Here is a photo of the sheets in my Spreadsheet 这是我的想法如何做到这一点 var sheet SpreadsheetA
如何分配二维数组？ [复制]

这个问题在这里已经有答案了我需要创建一个二维数组目前我将其创建为int a 100 100 但我需要使用动态分配内存malloc在C语言中我用了代码 include
AWS SAM CLI 在构建、打包和部署期间忽略我的 Python 依赖项

我正在尝试使用 MacOS 中的 SAM CLI 工具部署 AWS Lambda 函数而不是使用 Docker 容器 SAM CLI 版本 0 4 0 Lambda 函数的 Python 3 8 运行时 MacOS 上本地安装的 Pyth
LLVM 尾调用优化

以下是我对事情的理解当函数 f 调用自身是其最后一个动作时它是尾递归的通过形成循环而不是再次调用函数可以显着优化尾递归函数的参数已就地更新并且函数体再次运行这称为递归尾调用优化 LLVM 在使用 fastcc GHC 或 Hi

LLVM 尾调用优化

LLVM 尾调用优化 的相关文章

随机推荐

热门标签

LLVM 尾调用优化的相关文章