为什么返回 Java 对象引用比返回原语慢得多

2024-01-12

我们正在开发一个延迟敏感的应用程序，并且一直在对各种方法进行微基准测试（使用jmh http://openjdk.java.net/projects/code-tools/jmh/）。在对查找方法进行微基准测试并对结果感到满意后，我实现了最终版本，却发现最终版本是慢3倍比我刚刚进行的基准测试。

罪魁祸首是所实现的方法返回一个enum对象而不是int。这是基准代码的简化版本：

@OutputTimeUnit(TimeUnit.MICROSECONDS)
@State(Scope.Thread)
public class ReturnEnumObjectVersusPrimitiveBenchmark {

    enum Category {
        CATEGORY1,
        CATEGORY2,
    }

    @Param( {"3", "2", "1" })
    String value;

    int param;

    @Setup
    public void setUp() {
        param = Integer.parseInt(value);
    }

    @Benchmark
    public int benchmarkReturnOrdinal() {
        if (param < 2) {
            return Category.CATEGORY1.ordinal();
        }
        return Category.CATEGORY2.ordinal();        
    }


    @Benchmark
    public Category benchmarkReturnReference() {
        if (param < 2) {
            return Category.CATEGORY1;
        }
        return Category.CATEGORY2;      
    }


    public static void main(String[] args) throws RunnerException {
            Options opt = new OptionsBuilder().include(ReturnEnumObjectVersusPrimitiveBenchmark.class.getName()).warmupIterations(5)
                .measurementIterations(4).forks(1).build();
        new Runner(opt).run();
    }

}

上述基准测试结果：

# VM invoker: C:\Program Files\Java\jdk1.7.0_40\jre\bin\java.exe
# VM options: -Dfile.encoding=UTF-8

Benchmark                   (value)   Mode  Samples     Score     Error   Units
benchmarkReturnOrdinal            3  thrpt        4  1059.898 ±  71.749  ops/us
benchmarkReturnOrdinal            2  thrpt        4  1051.122 ±  61.238  ops/us
benchmarkReturnOrdinal            1  thrpt        4  1064.067 ±  90.057  ops/us
benchmarkReturnReference          3  thrpt        4   353.197 ±  25.946  ops/us
benchmarkReturnReference          2  thrpt        4   350.902 ±  19.487  ops/us
benchmarkReturnReference          1  thrpt        4   339.578 ± 144.093  ops/us

仅更改函数的返回类型即可将性能改变近 3 倍。

我认为返回枚举对象与整数之间的唯一区别在于，一个返回 64 位值（引用），另一个返回 32 位值。我的一位同事猜测返回枚举会增加额外的开销，因为需要跟踪潜在 GC 的引用。（但考虑到枚举对象是静态最终引用，需要这样做似乎很奇怪）。

性能差异的解释是什么？

UPDATE

我分享了maven项目here https://github.com/shalomshachne/shared-benchmarks.git这样任何人都可以克隆它并运行基准测试。如果有人有时间/兴趣，看看其他人是否可以复制相同的结果将会很有帮助。（我在两台不同的机器上进行了复制，Windows 64 和 Linux 64，都使用 Oracle Java 1.7 JVM 风格）。 @ZhekaKozlov 说他没有看到这些方法之间有任何区别。

运行：（克隆存储库后）

mvn clean install
java -jar .\target\microbenchmarks.jar function.ReturnEnumObjectVersusPrimitiveBenchmark -i 5 -wi 5 -f 1

TL;DR：你不应该盲目信任任何事情。

首先，重要的是先验证实验数据，然后再得出结论。仅仅声称某些东西快/慢 3 倍是很奇怪的，因为您确实需要跟进性能差异的原因，而不仅仅是相信数字。这对于像您这样的纳米基准测试尤其重要。

其次，实验者应该清楚地了解他们控制什么和不控制什么。在您的特定示例中，您返回的值来自@Benchmark方法，但是您能否合理确定外部调用者会对原语和引用执行相同的操作？如果您问自己这个问题，您就会意识到您基本上是在测量测试基础设施。

切入正题。在我的机器（i5-4210U、Linux x86_64、JDK 8u40）上，测试结果：

Benchmark                    (value)   Mode  Samples  Score   Error   Units
...benchmarkReturnOrdinal          3  thrpt        5  0.876 ± 0.023  ops/ns
...benchmarkReturnOrdinal          2  thrpt        5  0.876 ± 0.009  ops/ns
...benchmarkReturnOrdinal          1  thrpt        5  0.832 ± 0.048  ops/ns
...benchmarkReturnReference        3  thrpt        5  0.292 ± 0.006  ops/ns
...benchmarkReturnReference        2  thrpt        5  0.286 ± 0.024  ops/ns
...benchmarkReturnReference        1  thrpt        5  0.293 ± 0.008  ops/ns

好的，所以参考测试看起来慢了 3 倍。但是等等，它使用旧的 JMH (1.1.1)，让我们更新到当前最新版本 (1.7.1)：

Benchmark                    (value)   Mode  Cnt  Score   Error   Units
...benchmarkReturnOrdinal          3  thrpt    5  0.326 ± 0.010  ops/ns
...benchmarkReturnOrdinal          2  thrpt    5  0.329 ± 0.004  ops/ns
...benchmarkReturnOrdinal          1  thrpt    5  0.329 ± 0.004  ops/ns
...benchmarkReturnReference        3  thrpt    5  0.288 ± 0.005  ops/ns
...benchmarkReturnReference        2  thrpt    5  0.288 ± 0.005  ops/ns
...benchmarkReturnReference        1  thrpt    5  0.288 ± 0.002  ops/ns

哎呀，现在他们只慢了一点点。顺便说一句，这也告诉我们测试是受基础设施限制的。好吧，我们能看看到底发生了什么吗？

如果你建立基准，并看看到底什么才是你的@Benchmark方法，然后你会看到类似的内容：

public void benchmarkReturnOrdinal_thrpt_jmhStub(InfraControl control, RawResults result, ReturnEnumObjectVersusPrimitiveBenchmark_jmh l_returnenumobjectversusprimitivebenchmark0_0, Blackhole_jmh l_blackhole1_1) throws Throwable {
    long operations = 0;
    long realTime = 0;
    result.startTime = System.nanoTime();
    do {
        l_blackhole1_1.consume(l_longname.benchmarkReturnOrdinal());
        operations++;
    } while(!control.isDone);
    result.stopTime = System.nanoTime();
    result.realTime = realTime;
    result.measuredOps = operations;
}

That l_blackhole1_1 has a consume方法，它“消耗”这些值（参见Blackhole为理由）。Blackhole.consume有过载参考 http://hg.openjdk.java.net/code-tools/jmh/file/96d8047fbf9a/jmh-core/src/main/java/org/openjdk/jmh/infra/Blackhole.java#l298 and 原语 http://hg.openjdk.java.net/code-tools/jmh/file/96d8047fbf9a/jmh-core/src/main/java/org/openjdk/jmh/infra/Blackhole.java#l384，仅此一点就足以证明性能差异是合理的。

这些方法看起来不同是有原因的：它们试图尽可能快地处理它们的论证类型。即使我们尝试匹配它们，它们也不一定表现出相同的性能特征，因此新 JMH 的结果更加对称。现在，您甚至可以前往-prof perfasm查看为测试生成的代码并了解性能不同的原因，但这超出了这里的重点。

如果你真的want要了解返回原语和/或引用在性能方面有何不同，您需要输入大可怕的灰色地带细致入微的性能基准测试。例如。像这样的测试：

@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@Warmup(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS)
@Measurement(iterations = 5, time = 1, timeUnit = TimeUnit.SECONDS)
@Fork(5)
public class PrimVsRef {

    @Benchmark
    public void prim() {
        doPrim();
    }

    @Benchmark
    public void ref() {
        doRef();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    private int doPrim() {
        return 42;
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    private Object doRef() {
        return this;
    }

}

...这对于基元和引用产生相同的结果：

Benchmark       Mode  Cnt  Score   Error  Units
PrimVsRef.prim  avgt   25  2.637 ± 0.017  ns/op
PrimVsRef.ref   avgt   25  2.634 ± 0.005  ns/op

正如我上面所说，这些测试require跟进结果的原因。在这种情况下，两者生成的代码几乎相同，这解释了结果。

prim:

                  [Verified Entry Point]
 12.69%    1.81%    0x00007f5724aec100: mov    %eax,-0x14000(%rsp)
  0.90%    0.74%    0x00007f5724aec107: push   %rbp
  0.01%    0.01%    0x00007f5724aec108: sub    $0x30,%rsp         
 12.23%   16.00%    0x00007f5724aec10c: mov    $0x2a,%eax   ; load "42"
  0.95%    0.97%    0x00007f5724aec111: add    $0x30,%rsp
           0.02%    0x00007f5724aec115: pop    %rbp
 37.94%   54.70%    0x00007f5724aec116: test   %eax,0x10d1aee4(%rip)        
  0.04%    0.02%    0x00007f5724aec11c: retq

ref:

                  [Verified Entry Point]
 13.52%    1.45%    0x00007f1887e66700: mov    %eax,-0x14000(%rsp)
  0.60%    0.37%    0x00007f1887e66707: push   %rbp
           0.02%    0x00007f1887e66708: sub    $0x30,%rsp         
 13.63%   16.91%    0x00007f1887e6670c: mov    %rsi,%rax     ; load "this"
  0.50%    0.49%    0x00007f1887e6670f: add    $0x30,%rsp
  0.01%             0x00007f1887e66713: pop    %rbp
 39.18%   57.65%    0x00007f1887e66714: test   %eax,0xe3e78e6(%rip)
  0.02%             0x00007f1887e6671a: retq

[讽刺]看看这有多容易！ [/讽刺]

模式是：问题越简单，你就越需要做出更多的努力才能得出合理且可靠的答案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么返回 Java 对象引用比返回原语慢得多的相关文章

Java：扩展类并实现具有相同方法的接口

可能无法完成以下操作我收到编译错误继承的方法 A doSomthing int 无法隐藏 B 中的公共抽象方法 public class A int doSomthing int x return x public interface
使用 Tabula 通过 Python 读取 pdf 时出现 Java 错误

我已经安装了 tabula 库用于使用 python 将 pdf 读取到 pandas 数据框中但是当我运行代码时 import tabula df tabula read pdf sample1 pdf pages 1 我得到了例外
有没有创建 Cron 表达式的 Java 代码？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我需要一个 Java 代码来根据用户输入创建一个 cron 表达式用户输入是时间频率和执行次数只需从评论中添加自己创建即可
TreeMap 删除所有大于某个键的键

在项目中我需要删除键值大于某个键的所有对象键类型为Date 如果重要的话据我所知TreeMapJava中实现的是红黑树它是一种二叉搜索树所以我应该得到O n 删除子树时但除了制作尾部视图并一一删除之外我找不到任何方法可以做到这
Java Logger 未记录到 Netbeans 中的输出

我正在 Netbeans 中使用 Maven 启动一个 Java 项目我编写了一些代码来使用 Logger 类进行日志记录但是日志记录似乎不起作用在程序开始时我运行 Logger getLogger ProjectMainClas
与 Eclipse 中的 Java Content Assist 交互

作为我的插件项目的一部分我正在考虑与 Eclipse 在 Java 文件上显示的内容辅助列表进行交互我正在尝试根据一些外部数据对列表进行重新排序我看过一些有关创建新内容辅助的教程但没有看到有关更改现有内容辅助的教程这可能吗如果是
eclipse行号状态行贡献项是如何实现的？

我需要更新状态行编辑器特定的信息我已经有了自己的实现但我想看看 eclipse 贡献项是如何实现的它显示状态行中的行号列位置谁能指点一下哪里可以找到源代码提前致谢亚历克斯 G 我一直在研究它它非常复杂我不确定我是否了解完
从 MATLAB 调用 Java？

我想要Matlab程序调用java文件最好有一个例子需要考虑三种情况 Java 内置库也就是说任何描述的here http docs oracle com javase 6 docs api 这些项目可以直接调用例如 map ja
断言 Kafka 发送有效

我正在使用 Spring Boot 编写一个应用程序因此要写信给 Kafka 我这样做 Autowired private KafkaTemplate
Java 中如何将 char 转换为 int？ [复制]

这个问题在这里已经有答案了我是Java编程新手我有例如 char x 9 我需要得到撇号中的数字即数字 9 本身我尝试执行以下操作 char x 9 int y int x 但没有成功那么我应该怎么做才能得到撇号中的数字呢 ASC
将非 Android 项目添加到 Android 项目

我在 Eclipse 中有三个项目 Base Server 和 AndroidClient Base和Server是Java 1 7项目而AndroidClient显然是一个android项目基础项目具有在服务器和 Android 客户
如何在 Spring 中使 @PropertyResource 优先于任何其他 application.properties ？

我正在尝试在类路径之外添加外部配置属性资源它应该覆盖任何现有的属性但以下方法不起作用 SpringBootApplication PropertySource d app properties public class MyClass
从jar中获取资源

我有包含文件的 jar myJar res endingRule txt myJar wordcalculator merger Marge class 在 Marge java 中我有代码 private static final Str
提高 PostgreSQL 1 亿数据左连接查询性能

我在用Postgresql 9 2 version Windows 7 64 bit RAM 6GB 这是一个Java企业项目我必须在我的页面中显示订单相关信息有三个表通过左连接连接在一起 Tables TV HD 389772 行 T
Jetty、websocket、java.lang.RuntimeException：无法加载平台配置器

我尝试在 Endpoint 中获取 http 会话我遵循了这个建议https stackoverflow com a 17994303 https stackoverflow com a 17994303 这就是我这样做的原因 publi
不可变的最终变量应该始终是静态的吗？ [复制]

这个问题在这里已经有答案了在java中如果一个变量是不可变的并且是final的那么它应该是一个静态类变量吗我问这个问题是因为每次类的实例使用它时创建一个新对象似乎很浪费因为无论如何它总是相同的 Example 每次调用方法时都会创
hibernate 6.0.2.Final 和 spring boot 2.7.0 的entityManagerFactory bean 未配置问题

所以最近我想升级我的 Spring Boot 项目项目的一些依赖项特别是这些组件雅加达 EE 9 弹簧靴2 7 休眠 6 0 2 Final 完成此操作后所有更新和代码折射更新将 javax 导入到 jakarta 以及一些 hib
Android S8+ 警告消息“不支持当前的显示尺寸设置，可能会出现意外行为”

我在 Samsung S8 Android 7 中收到此警告消息 APP NAME 不支持当前的显示尺寸设置可能会行为出乎意料它意味着什么以及如何删除它谢谢通过添加解决supports screens 机器人 xlargeScre
java XMLSerializer 避免复杂的空元素

我有这个代码 DocumentBuilderFactory factory DocumentBuilderFactory newInstance DocumentBuilder builder factory newDocumentBuil
子类构造函数（JAVA）中的重写函数[重复]

这个问题在这里已经有答案了为什么在派生类构造函数中调用超类构造函数时 id 0 当创建子对象时什么时候在堆中为该对象分配内存在基类构造函数运行之后还是之前 class Parent int id 10 Parent meth void

随机推荐

chrome.tabs.executeScript 抛出错误“运行 tabs.executeScript 时未检查runtime.lastError：无法访问 url 的内容...”

所以我试图在background js 中执行来自外部源例如www script google com 的脚本但我收到这个错误 Unchecked runtime lastError while running tabs execute
返回对向量成员变量的引用

我有一个向量作为类中的成员我想通过 getVector 函数返回对它的引用以便以后能够修改它将函数 getVector 练习为 const 不是更好吗但是我在以下代码中收到错误限定符在类型的绑定引用中被删除应该修改什么 cla
填充 CSV 文件中的空白

我有一个 CSV 文件其中某些列为空例如 oski14 safe 0 13 53 4 oski15 Unknow 0 oski16 Unknow 0 oski17 Unknow 0 oski18 unsafe 0 55 1 2 oski
codeigniter php 有论坛吗？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有基于codeigniter的论坛软件免费还是商业我自己还没有尝试过其中任何一个但我听说过非常
Java 中的 SQLite 连接池 - 锁定数据库

我已经阅读了一些有关多线程环境中 SQLite 的相关主题但我找不到明确的说法所以请原谅我再次提出这个主题我需要从多个线程访问应用程序的数据库以执行更新语句数据库本身可以是 SQLite 或 MySQL 具体取决于用户的选择对于
Nestjs 的 Swagger Codegen

我已经使用 Swaggerhub 创建了 api 端点并成功导出以与 asp net core 一起运行我想用 Nestjs 测试相同的 api 但我发现用 openapi 进行记录但反之则不然将 yaml 转换为 Nodejs 有
Grails 日期绑定

在 Grails 中可以在控制器中 bindData Book b new Book bindData b params 如果我有一个来自用户输入的具有特定格式例如 yyyy MM dd 的日期字段怎么办在Spring中我们可以使用
如果未找到 Wi-Fi AP，则不会调用 NetworkCallback 的 onUnavailable() 方法

我正在尝试将我的智能手机连接到 IOT 设备制作的 AP 我将connectivitymanager requestNetwork 与NetworkCallback 一起使用一切正常直到我关闭我的AP 并且显然requestNetwor
文件错误（文件，“rt”）：无法打开连接[重复]

这个问题在这里已经有答案了我是 R 新手在广泛研究此错误后我仍然无法找到解决方案这是代码我检查了我的工作目录并确保文件位于正确的目录中欣赏它谢谢 pollutantmean lt function directory pol
在选项卡内切换选项卡

MainActivity java public class MainActivity extends FragmentActivity Fragment TabHost as mTabHost private FragmentTabHos
从一个领域异步复制到另一个领域

据我了解 Realm只能应该从主线程访问我使用两个领域一个用于存储脏数据这些数据在验证后将被移动到真实领域到目前为止一切顺利但我找不到在主线程之外执行此操作的方法如果我使用写入真实领域realm executeTransa
Android：将 android.net.Uri 对象保存到数据库

我想做的是从用户那里获取选定的铃声设置 AlarmManager 闹钟以在闹钟关闭时播放该铃声但我需要将铃声保存在数据库中以便在手机重启后重置所有警报我的问题是将铃声 Uri 保存到数据库以便稍后检索的最佳方法是什么我尝试了以下方
使用带有 FX 的 OpenJDK 的 Azul Zulu Builds 将 JavaFX 项目升级到 JDK 17 后，为什么 IDEA 找不到 JavaFX 包？

我有一个 Java FX 项目并使用以下 Azul Zulu Build of OpenJDK with JavaFX 将项目升级到 JDK 17 有谁知道为什么 Intellij 无法从 Azul Zulu Builds of Open
在 Groovy MarkupBuilder 中使用命名空间

我想要有以下输出
从 C# 列表中选择唯一元素

如何从列表中选择独特的元素 0 1 2 2 2 3 4 4 5 这样我得到 0 1 3 5 有效去除的所有实例重复的元素 2 4 var numbers new 0 1 2 2 2 3 4 4 5 var uniqueNumbers fro
如何使用 EWS 从 Outlook 联系人读取扩展属性

我当前正在尝试通过 Microsoft 的 EWS 托管 API 从 Outlook 联系人对象读取某些属性我从以下位置检索这些联系人对象FindItems 功能其中一些字段是扩展属性例如Title or User1领域我很难阅读它
iOS 上 JavaScriptCore 虚拟机的强制垃圾回收

有没有办法强制 iOS 或 Mac OS JavaScriptCore VM 垃圾收集器运行我只需要它来测试内存泄漏所以私有 API 就可以了使用 JSBase h 中的以下函数 function JSGarbageCollect a
哪些 Knockout.js 绑定是“双向”的？

Knockout js 拥有双向绑定并且实例展示 http knockoutjs com examples helloWorld html如何value绑定当应用于文本输入时更新视图模型但是我尝试更新其他绑定例如text 发现视
Python二进制文件读取问题

我正在尝试在 Python 中读取一个二进制文件代表 Matlab 中的矩阵但我在读取文件并将字节转换为正确的值时遇到问题二进制文件由一系列 4 字节数字组成前两个数字分别是行数和列数我的朋友给了我一个他编写的 Matlab 函数
为什么返回 Java 对象引用比返回原语慢得多

我们正在开发一个延迟敏感的应用程序并且一直在对各种方法进行微基准测试使用jmh http openjdk java net projects code tools jmh 在对查找方法进行微基准测试并对结果感到满意后我实现了最终版本

为什么返回 Java 对象引用比返回原语慢得多

为什么返回 Java 对象引用比返回原语慢得多 的相关文章

随机推荐

热门标签

为什么返回 Java 对象引用比返回原语慢得多的相关文章