LLVM insertvalue 优化不佳？

2023-12-08

当我发出 LLVM 代码时，是否应该避免将“insertvalue”指令与加载和存储结合使用？当我使用它时，我总是得到糟糕的优化本机代码。看下面的例子：

; ModuleID = 'mod'
target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64"
target triple = "x86_64-pc-linux-gnu"

%A = type { i64, i64, i64, i64, i64, i64, i64, i64 }

@aa = external global %A*

define void @func() {
entry:
  %a1 = load %A** @aa
  %a2 = load %A* %a1
  %a3 = insertvalue %A %a2, i64 3, 3
  store %A %a3, %A* %a1
  ret void
}

当我运行“llc -o - -O3 mod.ll”时，我得到了这个可怕的代码：

func:                                   # @func
.Ltmp0:
        .cfi_startproc
# BB#0:                                 # %entry
        movq    aa(%rip), %rax
        movq    (%rax), %r8
        movq    8(%rax), %r9
        movq    16(%rax), %r10
        movq    32(%rax), %rdi
        movq    40(%rax), %rcx
        movq    48(%rax), %rdx
        movq    56(%rax), %rsi
        movq    %rsi, 56(%rax)
        movq    %rdx, 48(%rax)
        movq    %rcx, 40(%rax)
        movq    %rdi, 32(%rax)
        movq    %r10, 16(%rax)
        movq    %r9, 8(%rax)
        movq    %r8, (%rax)
        movq    $3, 24(%rax)
        ret

但我想看到的是这样的：

func:                                   # @func
.Ltmp0:
        .cfi_startproc
# BB#0:                                 # %entry
        movq    aa(%rip), %rax
        movq    $3, 24(%rax)
        ret

当然我可以使用 getelementptr 之类的，但有时生成 insertvalue 和 extractvalue 指令更容易，我希望对这些进行优化...

我认为代码生成器很容易发现这样的事情是不好的：

        movq    56(%rax), %rsi
        movq    %rsi, 56(%rax)

首先，请注意 llc 不进行任何 IR 级别的优化。因此，您应该运行 opt 来运行 IR 级优化器集。

然而，opt 对此没有帮助。我希望标准 IR 级优化器能够以某种方式将这些内容规范化为 gep 。

请提交 LLVM PR，这看起来像是错过了优化！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Optimization

codegeneration

LLVM

x8664

LLVM insertvalue 优化不佳？的相关文章

无法覆盖 Symfony2 GeneratorBundle 中的标准骨架视图

我无法覆盖 GeneratorBundle 的骨架视图我首先尝试在 app Resources SensioGeneratorBundle sculpt crud views index html twig 中添加我的视图它不起作用所
一个单元在哪一级测试无锁代码？

Can LLVM https packages debian org stretch llvm QEMU https packages debian org stretch qemu kvm GDB https packages debia
从 64 位 nasm 代码接收 32 位寄存器

我正在学习 64 位 nasm 我通过执行以下操作来汇编 nasm 文件该文件仅包含 64 位寄存器 nasm f elf64 HelloWorld nasm o HelloWorld o 并链接它执行以下操作 ld HelloWorld
优化视图状态

是否有人对优化 ASP NET 应用程序的视图状态有任何想法或参考可以向我指出我不想把它全部关闭优化它的主要目标是提高性能所以我不想运行一个昂贵的函数来递归地禁用某些控件的视图状态因为该函数会减慢速度页面的加载时间会达不到目的有任
如何优化这个MySQL慢（非常慢）查询？

我有一个 2 GB 的 mysql 表包含 500k 行我在没有负载的系统上运行以下查询 select from mytable where name in n1 n2 n3 n4 bunch more order by salary
使用非规范地址检索内存数据会导致 SIGSEGV 而不是 SIGBUS

我无法使用以下汇编代码产生总线错误这里我使用的内存地址不是合法的规范地址那么我怎样才能触发该错误呢我在带有 NASM 2 14 02 的 Ubuntu 20 04 LTS 下运行这段代码但它会导致负载出现 SIGSEGV 分段
Gekko - 最佳调度的不可行解决方案，与 gurobi 的比较

我对 Gurobi 有点熟悉但转向 Gekko 因为后者似乎有一些优势不过我遇到了一个问题我将用我想象的苹果园来说明这一问题 5周的收获期 horizon T 5 就在我们身上我的非常微薄的产出将是 3 0 7 0 9 0 5
错误优化器参数在 Keras 函数中不合法

我使用以下代码来计算数据生成质量指标的拟合优度研究的概率标签 from sklearn model selection import StratifiedKFold from sklearn model selection import K
打印数字时添加千位分隔符[重复]

这个问题在这里已经有答案了我真的不知道这个问题的名称所以它可能是一个不正确的标题但问题很简单如果我有一个数字例如 number 23543 second 68471243 我想要它使print 像这样 23 54368 471
如何用 clang 替换 llvm-ld ？

Summary llvm ld已从LLVM 3 2 版本 http llvm org releases 3 2 docs ReleaseNotes html 我试图弄清楚如何在我的构建系统中使用 clang 请注意我在编写时找到了自己问题
循环中的恒定条件：编译器优化[重复]

这个问题在这里已经有答案了考虑以下代码 Preprocessor include
如何将 IR 保存到文件并将其构建为可执行文件？

现在我使用 clang 将 c 文件构建为 s 文件我已经使用llvm API修改了IR 但是现在我无法将修改后的 IR 保存到文件中我想使用 LLVMWriteBitcodeToFile 但找不到 LLVMOpaqueModule
超越堆栈采样：C++ 分析器

黑客的故事日期是 2010 年 2 月 12 日圣诞节前的日子已经过去了作为一名 Windows 程序员我几乎遇到了一个主要障碍我一直在使用 AQTime 我尝试过 sleepy shiny very sleepy 就在我们说话的
InnoDB vs. MyISAM 插入查询时间

我有一个大型 MySQL 表约 1000 万行 6 5G 用于读取和写入它是MyISAM 由于MyISAM 的所有表写入锁我获得了很多锁我决定尝试迁移到 InnoDB 推荐用于读写表它只锁定写入时的特定行转换后我测试了插入语
如何防止编译器优化掉断点？

我编写了一个 if 子句来检查是否应该中断程序进行调试 if a lt 0 a a a不应该变成负数但我发现它确实如此并且我想中断调试以了解如果发生这种情况它为什么会变成负数因此我编写了这个 if 子句在线上a a 我设置了一个断点
如何正确触发 ACTION_REQUEST_IGNORE_BATTERY_OPTIMIZATIONS 意图？

如文档中所述持有 REQUEST IGNORE BATTERY OPTIMIZATIONS 权限的应用程序可以触发系统对话框让用户直接将应用程序添加到白名单而无需进入设置该应用程序会触发 ACTION REQUEST IGNORE
我应该如何优化 .net 代码中对一个简单存储过程的多次调用？

我有一个非常简单的存储过程 create procedure spFoo v varchar 50 as insert into tbFoo select v 我有 50 个值要插入到 tbFoo 中这意味着在我的 c 代码中我调用 sp
是否有类似 BNF 的语法来描述 LLVM IR？

我想知道是否有 BNF 语法来描述 LLVM IR 如描述C语言的C BNF语法等 My LLVM 汇编语言解析器 https github com dylan lang opendylan blob master sources lib
为什么字符串加法需要这么长时间才能构建？

我正在添加文本UIlabel 及其性能成本我使用过构建时间分析器使用此链接 https stackoverflow com questions 43455325 swift build time too long when the con
在游戏行业担任优化员的基本技能[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi

随机推荐

Jquery 中的 XML 解析

我有一个 XML 文件其中有四个
如何使用特定的TaskScheduler使TaskCompletionSource.Task完成

怎样才能完成TaskCompletionSource Task发生在特定的TaskScheduler 当我打电话时TaskCompletionSource SetResult 目前我正在使用我借用的想法这个帖子 static public
如何使用批处理（.bat）脚本在给定行号的情况下删除文本文件的一行？

我想编写一个批处理脚本用户可以在其中输入行号脚本将删除文本文件的该行例如 tmp txt 1 aaa 2 bbb 3 ccc 4 ddd 我希望当我执行我的脚本和用户输入 3 时 tmp txt 是 1 aaa 2 bbb 4 ddd
Rails - 使用复选框选择多个对象并选择要执行的操作

我希望能够为对象列表创建复选框然后向用户提供对所选对象执行的许多操作 IE 删除存档等我知道 ryan 的截屏视频但它没有解释如何为所选对象创建多个操作的链接它只是显示他创建一个 form tag 其中包含一个操作的 url 和一
在非托管 C++ 程序中实现 C# DLL COM 文件

这是我的另一个问题也导致了这个问题作为参考如何从非托管 C 调用托管 C 方法我已成功创建 C COM 文件现在我需要一个关于如何在非托管 C 中实现它的简单解释我正在遵循这个示例但 C 部分很弱 http www codepr
JTextField 的值更改侦听器

我希望在用户更改文本字段中的值后立即显示消息框目前我需要按 Enter 键才能弹出消息框我的代码有什么问题吗 textField addActionListener new java awt event ActionListener
如何在我的汇编代码中调用 C++ 函数

我需要从程序集中调用 PrintResult 来显示结果我知道我必须在某处使用 extrn PrintResult 并且我应该使用 call PrintResult 来调用该函数但我不太确定如何使用它有什么建议 public Squa
NSAttributedString 的boundingRectWithSize 返回错误的大小

我试图获取属性字符串的矩形但boundingRectWithSize调用不考虑我传入的大小并且返回一个具有单行高度的矩形而不是一个大高度它是一个长字符串我已经尝试过传递一个非常大的高度值和 0 如下面的代码所示但返回的矩形始终是
如何在页面关闭时执行 PHP 代码？

我试图找到一种方法来在用户关闭页面后执行一些 PHP 代码在我的应用程序中一旦用户关闭或导航离开页面服务器就会在数据库中将用户状态为离线这需要代码知道用户何时离开页面我的应用程序也有无限的负载即它将休眠直到用户关闭页面当用户
使用 Gulp 来连接和 Uglify 文件

我正在尝试使用 Gulp 来获取 3 个特定的 javascript 文件将它们连接起来然后将结果保存到文件中 concat js 获取这个串联文件并对其进行 uglify minify 然后将结果保存到另一个文件 uglify js
从 Jenkins 管道并行步骤收集数据

从并行步骤收集数据例如通过失败结果的最佳方法是什么到目前为止我已经达到了什么 groovy def fspam name spam spam name BEEN THERE TOO pipeline node slave stage
Spring Boot Application.properties 没有自动完成建议

我是 Spring Boot 初学者我使用 spring 初始化程序创建了一个示例项目在 application properties 中我想更改服务器端口但编辑器不知道什么都不知道有什么问题 IntelliJ IDEA 社区版不
使用 es6 或 lodash 将字符串数组转换为对象数组

我有一个字符串数组我想将其转换为对象数组 array a b c 我想生成 array name a isChecked false availibility 0 name b isChecked false availibility 0
Android ndk 上 OpenGLES 1.1 中具有 GLSurfaceView 模式的 FrameBuffer

在 Android NDK 中是否可以使 OpenGL ES 1 1 使用典型的 java 端 GLSurfaceView 模式覆盖 GLSurfaceView Renderer onDrawFrame onSurfaceCreated
不要在提交表单时重定向

我有一个简单的基于 HTML 的表单如下所示它会在单击时不断刷新页面
我可以将跨站点标记的数据作为 blob 获取吗？

我正在尝试将网页链接到的几个图像保存到离线存储中我在 Firefox 上使用 IndexedDB 在 Chrome 上使用 FileSystem API 我的代码实际上是一个扩展因此在 Firefox 上我在 Greasemonkey
Mangle dll 使用 DEF 文件导出名称

我正在尝试创建一个代理 dll 并遇到了这个问题假设我有以下文件 a cpp extern C int declspec dllexport func int x return x a def EXPORTS func 4Test QAE
使用Scrapy爬取本地XML文件-Start URL本地文件地址

我想用 scrapy 抓取我位于下载文件夹中的本地 xml 文件使用 xpath 提取相关信息使用 scrapy 介绍作为guide 2016 01 24 12 38 53 scrapy DEBUG Retrying
数据成员 int 引用

我试图通过引用将 int 存储为类的数据成员我预计对象会通过引用获取 int 而不是如果我从外部增加引用则会增加对象内部的值 class A private int x public A int y x y cout lt lt A s
LLVM insertvalue 优化不佳？

当我发出 LLVM 代码时是否应该避免将 insertvalue 指令与加载和存储结合使用当我使用它时我总是得到糟糕的优化本机代码看下面的例子 ModuleID mod target datalayout e p 64 64 64

LLVM insertvalue 优化不佳？

LLVM insertvalue 优化不佳？ 的相关文章

随机推荐

热门标签

LLVM insertvalue 优化不佳？的相关文章