通过 JMH 测量 sun.misc.Unsafe.compareAndSwap 中的奇怪行为

2023-12-20

我决定使用不同的锁定策略来测量增量，并为此使用 JMH。我使用 JMH 来检查吞吐量和平均时间，并使用简单的自定义测试来检查正确性。有六种策略：

原子数
读写锁定计数
与易失性同步
无易失性的同步块
sun.misc.Unsafe.compareAndSwap
sun.misc.Unsafe.getAndAdd
不同步计数

基准代码：

@State(Scope.Benchmark)
@BenchmarkMode({Mode.Throughput, Mode.AverageTime})
@OutputTimeUnit(TimeUnit.MICROSECONDS)
@Fork(1)
@Warmup(iterations = 5)
@Measurement(iterations = 5)
public class UnsafeCounter_Benchmark {
    public Counter unsync, syncNoV, syncV, lock, atomic, unsafe, unsafeGA;

    @Setup(Level.Iteration)
    public void prepare() {
        unsync = new UnsyncCounter();
        syncNoV = new SyncNoVolatileCounter();
        syncV = new SyncVolatileCounter();
        lock = new LockCounter();
        atomic = new AtomicCounter();
        unsafe = new UnsafeCASCounter();
        unsafeGA = new UnsafeGACounter();
    }

    @Benchmark
    public void unsyncCount() {
        unsyncCounter();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void unsyncCounter() {
        unsync.increment();
    }

    @Benchmark
    public void syncNoVCount() {
        syncNoVCounter();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void syncNoVCounter() {
        syncNoV.increment();
    }

    @Benchmark
    public void syncVCount() {
        syncVCounter();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void syncVCounter() {
        syncV.increment();
    }

    @Benchmark
    public void lockCount() {
        lockCounter();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void lockCounter() {
        lock.increment();
    }

    @Benchmark
    public void atomicCount() {
        atomicCounter();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void atomicCounter() {
        atomic.increment();
    }

    @Benchmark
    public void unsafeCount() {
        unsafeCounter();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void unsafeCounter() {
        unsafe.increment();
    }

    @Benchmark
    public void unsafeGACount() {
        unsafeGACounter();
    }

    @CompilerControl(CompilerControl.Mode.DONT_INLINE)
    public void unsafeGACounter() {
        unsafeGA.increment();
    }

    public static void main(String[] args) throws RunnerException {
        Options baseOpts = new OptionsBuilder()
                .include(UnsafeCounter_Benchmark.class.getSimpleName())
                .threads(100)
                .jvmArgs("-ea")
                .build();

        new Runner(baseOpts).run();
    }
}

和替补的结果：

JDK 8u20

Benchmark                                         Mode  Samples   Score    Error   Units
o.k.u.u.UnsafeCounter_Benchmark.atomicCount      thrpt        5  42.178 ± 17.643  ops/us
o.k.u.u.UnsafeCounter_Benchmark.lockCount        thrpt        5  24.044 ±  2.264  ops/us
o.k.u.u.UnsafeCounter_Benchmark.syncNoVCount     thrpt        5  22.849 ±  1.344  ops/us
o.k.u.u.UnsafeCounter_Benchmark.syncVCount       thrpt        5  20.235 ±  2.027  ops/us
o.k.u.u.UnsafeCounter_Benchmark.unsafeCount      thrpt        5  12.460 ±  1.326  ops/us
o.k.u.u.UnsafeCounter_Benchmark.unsafeGACount    thrpt        5  39.106 ±  2.966  ops/us
o.k.u.u.UnsafeCounter_Benchmark.unsyncCount      thrpt        5  93.076 ±  9.674  ops/us
o.k.u.u.UnsafeCounter_Benchmark.atomicCount       avgt        5   2.604 ±  0.133   us/op
o.k.u.u.UnsafeCounter_Benchmark.lockCount         avgt        5   4.161 ±  0.546   us/op
o.k.u.u.UnsafeCounter_Benchmark.syncNoVCount      avgt        5   4.440 ±  0.523   us/op
o.k.u.u.UnsafeCounter_Benchmark.syncVCount        avgt        5   5.073 ±  0.439   us/op
o.k.u.u.UnsafeCounter_Benchmark.unsafeCount       avgt        5   9.088 ±  5.964   us/op
o.k.u.u.UnsafeCounter_Benchmark.unsafeGACount     avgt        5   2.611 ±  0.164   us/op
o.k.u.u.UnsafeCounter_Benchmark.unsyncCount       avgt        5   1.047 ±  0.050   us/op

大多数测量正如我所期望的那样，除了UnsafeCounter_Benchmark.unsafeCount使用的是哪个sun.misc.Unsafe.compareAndSwapLong with while环形。它是最慢的锁定。

public void increment() {
    long before = counter;
    while (!unsafe.compareAndSwapLong(this, offset, before, before + 1L)) {
        before = counter;
    }
}

我认为性能低下是因为 while 循环和 JMH 造成更高的争用，但是当我检查正确性时Executors我得到的数字符合我的预期：

Counter result: UnsyncCounter 97538676
Time passed in ms:259
Counter result: AtomicCounter 100000000
Time passed in ms:1805
Counter result: LockCounter 100000000
Time passed in ms:3904
Counter result: SyncNoVolatileCounter 100000000
Time passed in ms:14227
Counter result: SyncVolatileCounter 100000000
Time passed in ms:19224
Counter result: UnsafeCASCounter 100000000
Time passed in ms:8077
Counter result: UnsafeGACounter 100000000
Time passed in ms:2549

正确性测试代码：

public class UnsafeCounter_Test {
    static class CounterClient implements Runnable {
        private Counter c;
        private int num;

        public CounterClient(Counter c, int num) {
            this.c = c;
            this.num = num;
        }

        @Override
        public void run() {
            for (int i = 0; i < num; i++) {
                c.increment();
            }
        }
    }

    public static void makeTest(Counter counter) throws InterruptedException {
        int NUM_OF_THREADS = 1000;
        int NUM_OF_INCREMENTS = 100000;
        ExecutorService service = Executors.newFixedThreadPool(NUM_OF_THREADS);
        long before = System.currentTimeMillis();
        for (int i = 0; i < NUM_OF_THREADS; i++) {
            service.submit(new CounterClient(counter, NUM_OF_INCREMENTS));
        }
        service.shutdown();
        service.awaitTermination(1, TimeUnit.MINUTES);
        long after = System.currentTimeMillis();
        System.out.println("Counter result: " + counter.getClass().getSimpleName() + " " + counter.getCounter());
        System.out.println("Time passed in ms:" + (after - before));
    }

    public static void main(String[] args) throws InterruptedException {
        makeTest(new UnsyncCounter());
        makeTest(new AtomicCounter());
        makeTest(new LockCounter());
        makeTest(new SyncNoVolatileCounter());
        makeTest(new SyncVolatileCounter());
        makeTest(new UnsafeCASCounter());
        makeTest(new UnsafeGACounter());
    }
}

我知道这是一个非常糟糕的测试，但在这种情况下，Unsafe CAS 比 Sync 变体快两倍，并且一切都按预期进行。有人可以澄清所描述的行为吗？有关更多信息，请参阅 GitHub 存储库：Bench https://github.com/kirmit/algorithms_and_utils_benches/blob/develop/utils%20bench/src/main/java/org/kirmit/utils/unsafe/UnsafeCounter_Benchmark.java, 不安全的 CAS 计数器 https://github.com/kirmit/algorithms_and_utils_benches/blob/develop/utils%20bench/src/main/java/org/kirmit/utils/unsafe/concurrency/UnsafeCASCounter.java

大声思考：值得注意的是，人们经常做 90% 的乏味工作，而把 10%（乐趣开始的地方）留给其他人！好吧，我就尽情享受吧！

让我先在我的 i7-4790K、8u40 EA 上重复一下实验：

Benchmark                                 Mode  Samples    Score    Error   Units
UnsafeCounter_Benchmark.atomicCount      thrpt        5   47.669 ± 18.440  ops/us
UnsafeCounter_Benchmark.lockCount        thrpt        5   14.497 ±  7.815  ops/us
UnsafeCounter_Benchmark.syncNoVCount     thrpt        5   11.618 ±  2.130  ops/us
UnsafeCounter_Benchmark.syncVCount       thrpt        5   11.337 ±  4.532  ops/us
UnsafeCounter_Benchmark.unsafeCount      thrpt        5    7.452 ±  1.042  ops/us
UnsafeCounter_Benchmark.unsafeGACount    thrpt        5   43.332 ±  3.435  ops/us
UnsafeCounter_Benchmark.unsyncCount      thrpt        5  102.773 ± 11.943  ops/us

确实，有些事情看起来很可疑unsafeCount测试。实际上，在验证所有数据之前，您必须假设所有数据都是可疑的。对于纳米基准，您必须验证生成的代码，看看您是否真正测量了您想要测量的东西。在 JMH 中，它是很快就能做到 with -prof perfasm。事实上，如果你看看最热的地区unsafeCount在那里，你会注意到一些有趣的事情：

  0.12%    0.04%    0x00007fb45518e7d1: mov    0x10(%r10),%rax    
 17.03%   23.44%    0x00007fb45518e7d5: test   %eax,0x17318825(%rip)
  0.21%    0.07%    0x00007fb45518e7db: mov    0x18(%r10),%r11    ; getfield offset
 30.33%   10.77%    0x00007fb45518e7df: mov    %rax,%r8
  0.00%             0x00007fb45518e7e2: add    $0x1,%r8           
  0.01%             0x00007fb45518e7e6: cmp    0xc(%r10),%r12d    ; typecheck 
                    0x00007fb45518e7ea: je     0x00007fb45518e80b ; bail to v-call
  0.83%    0.48%    0x00007fb45518e7ec: lock cmpxchg %r8,(%r10,%r11,1)
 33.27%   25.52%    0x00007fb45518e7f2: sete   %r8b
  0.12%    0.01%    0x00007fb45518e7f6: movzbl %r8b,%r8d          
  0.03%    0.04%    0x00007fb45518e7fa: test   %r8d,%r8d
                    0x00007fb45518e7fd: je     0x00007fb45518e7d1 ; back branch

翻译：a)offset每次迭代都会重新读取字段——因为 CAS 内存效应意味着易失性读取，因此需要悲观地重新读取该字段； b) 搞笑的部分是unsafe场是also出于同样的原因，正在重新阅读以进行类型检查。

这就是为什么高性能代码应该如下所示：

--- a/utils bench/src/main/java/org/kirmit/utils/unsafe/concurrency/UnsafeCASCounter.java       
+++ b/utils bench/src/main/java/org/kirmit/utils/unsafe/concurrency/UnsafeCASCounter.java       
@@ -5,13 +5,13 @@ import sun.misc.Unsafe;

 public class UnsafeCASCounter implements Counter {
     private volatile long counter = 0;
-    private final Unsafe unsafe = UnsafeHelper.unsafe;
-    private long offset;
-    {
+    private static final Unsafe unsafe = UnsafeHelper.unsafe;
+    private static final long offset;
+    static {
         try {
             offset = unsafe.objectFieldOffset(UnsafeCASCounter.class.getDeclaredField("counter"));
         } catch (NoSuchFieldException e) {
-            e.printStackTrace();
+            throw new IllegalStateException("Whoops!");
         }
     }

如果您这样做，则unsafeCount性能立即提升：

Benchmark                              Mode  Samples   Score    Error   Units
UnsafeCounter_Benchmark.unsafeCount    thrpt        5  9.733 ± 0.673  ops/us

...考虑到误差范围，现在与同步测试相当接近。如果你看一下-prof perfasm现在，这是一个unsafeCount loop:

  0.08%    0.02%    0x00007f7575191900: mov    0x10(%r10),%rax       
 28.09%   28.64%    0x00007f7575191904: test   %eax,0x161286f6(%rip) 
  0.23%    0.08%    0x00007f757519190a: mov    %rax,%r11
                    0x00007f757519190d: add    $0x1,%r11
                    0x00007f7575191911: lock cmpxchg %r11,0x10(%r10)
 47.27%   23.48%    0x00007f7575191917: sete   %r8b
  0.10%             0x00007f757519191b: movzbl %r8b,%r8d        
  0.02%             0x00007f757519191f: test   %r8d,%r8d
                    0x00007f7575191922: je     0x00007f7575191900

这个循环非常紧，似乎没有什么能让它走得更快。我们花费大部分时间加载“更新”的值并实际对其进行 CAS 处理。但我们争论很多！为了弄清楚争用是否是主要原因，让我们添加退避：

--- a/utils bench/src/main/java/org/kirmit/utils/unsafe/concurrency/UnsafeCASCounter.java       
+++ b/utils bench/src/main/java/org/kirmit/utils/unsafe/concurrency/UnsafeCASCounter.java       
@@ -20,6 +21,7 @@ public class UnsafeCASCounter implements Counter {
         long before = counter;
         while (!unsafe.compareAndSwapLong(this, offset, before, before + 1L)) {
             before = counter;
+            Blackhole.consumeCPU(1000);
         }
     }

...跑步：

Benchmark                                 Mode  Samples    Score    Error   Units
UnsafeCounter_Benchmark.unsafeCount      thrpt        5   99.869 ± 107.933  ops/us

瞧。我们的确是more在循环中工作，但它使我们免于很多竞争。我之前尝试解释过这一点“纳米信任纳米时间” http://shipilev.net/blog/2014/nanotrusting-nanotime/，最好返回那里并阅读更多有关基准测试方法的内容，尤其是在测量重量级操作时。这凸显了整个实验中的陷阱，不仅是unsafeCount.

OP 和感兴趣的读者的练习：解释原因unsafeGACount and atomicCount比其他测试执行得快得多。你现在有了工具。

附：在具有 C (C

附言时间检查：10 分钟进行分析和附加实验，20 分钟进行撰写。您浪费了多少时间手动复制结果？ ;)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

通过 JMH 测量 sun.misc.Unsafe.compareAndSwap 中的奇怪行为的相关文章

如何在 JPanel 上绘制后重新绘制它？

我有一个继承自 JPanel 的组件我在上面绘制了一个网格现在我有一个 JComboBox 我希望用户能够在此处选择网格大小然后按按钮进行网格更改重新绘制网格问题是它绘制了初始网格但是一旦用户从 JComboBox 选择网格大小
eclipse juno 打开时出错

在安装 Eclipse 并正常工作一年多后我今天打开 Eclipse Juno 并在打开工作区时收到一条错误消息我使用的是 Windows 8 64 位 Java 64 位和 Eclipse 64 位此后我尝试重新安装 Java 和
匿名内部类显示不正确的修饰符

据我了解以下代码应该打印true作为输出但是当我运行这段代码时它正在打印false 来自 Java 文档15 9 5 匿名类 https docs oracle com javase specs jls se8 html jls 1
Java 弱哈希映射 - 需要根据值的弱点而不是键来删除条目

所以JavaWeakHashMap让我们创建一个映射如果其键变弱则删除该映射的条目但是我怎样才能创建一个Map 当它的条目被删除时values地图上变弱了我想使用映射的原因是作为全局哈希表它根据对象的 ID 跟踪对象 ID gt
如何用Java创建图像

比如说在我的程序中我有这个paint 方法我的愿望是创建所绘制的矩形的图像使用 for 循环我尝试了下面的方法它确实给了我那些矩形蓝色但背景是全黑的当我运行程序而不创建图像仅在 JFrame 上绘制矩形时背景为白色我怎
如何在流中收集到TreeMap中？

我有两个Collectors groupingBy在流中我需要收集所有信息TreeMap 我的代码 Map
Selenium - 保存网站，包括所有图像、css、dom

我想使用 firefox 或 chrome 访问带有 selenium 的页面当页面加载时我想从页面下载所有图像 css dom 我想存储每张图像就像我在其中找到它们一样 chrome gt Tools gt Development
@NotNull.List 的目的

当我查看标准时限制条件 http docs oracle com javaee 6 api javax validation constraints package summary html在 Bean Validation API JSR
从继承的受保护 Java 字段创建公共访问器

我怎样才能完成以下工作 class Foo extends javax swing undo UndoManager increase visibility works for method override def editToBeUnd
PrintStream是有缓冲的，但是flush不会降低性能，而BufferedOutputStream会加速性能

我预计由于 PrintStream 是缓冲的通过在每次 print 之后添加刷新操作速度性能应该会显着降低但事实并非如此如下面的代码片段所示此外将 PrintStream 包裹在 BufferedOutputStream 周围可
为什么 MetaSpace 大小是已用 MetaSpace 的两倍？

我写了一个程序来模拟MetaSpace OOM 但我发现MetaSpace Size几乎总是两倍大Used MetaSpace Why 我用标志运行我的程序 XX MaxMetaspaceSize 50m 程序抛出OOM时Used Meta
将二进制数据的 byte[] 转换为 String

我有二进制格式的数据 hex 80 3b c8 87 0a 89 我需要将其转换为字符串以便通过 Jackcess 将二进制数据保存在 MS Access 数据库中我知道我不打算在 Java 中使用 String 来存储二进制数据但
Java - 同步方法导致程序大幅减慢

我正在尝试了解线程和同步我做了这个测试程序 public class Test static List
Java 泛型和数字类型

我想创建一个通用方法来有效地执行此操作 class MyClass static
在 Java 5 及更高版本中迭代 java.util.Map 的所有键/值对的最简单方法是什么？

在 Java 5 及更高版本中迭代 java util Map 的所有键值对的最简单方法是什么假设K是您的密钥类型并且V是你的值类型 for Map Entry
kafka Avro 多个主题的消息反序列化器

我正在尝试以 avro 格式反序列化 kafka 消息我使用以下代码 https github com ivangfr springboot kafka debezium ksql blob master kafka research c
获取证书链

我正在 Java 中使用 X509 证书给定一个证书是否可以在签名层次结构中找到所有其他证书直到找到根证书我有一个证书文件带有 cer扩展名我想提取父签名证书我想继续查找该证书的父证书直到获得最终的自签名根证书我已经检查了
相当于 C# 中 Java 的“ByteBuffer.putType()”

我正在尝试通过从 Java 移植代码来格式化 C 中的字节数组在 Java 中使用方法 buf putInt value buf putShort buf putDouble 等等但我不知道如何将其移植到 C 我尝试过 MemoryS
如何将多部分文件从另一个服务发送到一个服务

我有两个端点 api 它们是 uploadand 重定向 upload是我直接上传文件的地方重定向是我接收文件并将其传递给上传并获取 JSON 响应的地方 upload 所以下面是我的代码 package com example impo
按字母顺序对对象的 ArrayList 进行排序

我必须创建一个方法来排序数组列表根据电子邮件按字母顺序排列对象然后打印排序后的数组我在排序时遇到麻烦的部分我已经研究过并尝试使用Collections sort vehiclearray 但这对我不起作用我是因为我需要一个叫做比较器

随机推荐

为什么分解声明不能是 constexpr？

请考虑以下代码片段来测试即将推出的 C 17 功能分解声明以前称为结构化绑定 include
pywin32 处于不受支持或无效的轮子中

我正在尝试安装 win32con pywin32 它给了我错误 pywin32 is in an unsupported or invalid wheel 并且帮助会很好 it s pip install pypiwin32但如果这不起作用
经典 ASP (VBScript) 替换字符串中的特殊字符表现得很奇怪

在经典 ASP VBScript 中当我替换字符串时会出现一个奇怪的字符如果我将其打印为 HTML 最终结果是其中有一个奇怪的 A My Ttitle 将其添加到页面顶部在文本编辑器中打开文件记事本即可从文件菜单中选择另存为
在mysql更新查询中使用c# datetime

我正在尝试使用 MySQL 网站上的 net mysql 连接器运行从 C 到 MySQL 版本 5 5 27 的查询我正在开发的 dll 的最终目标是跟踪我已读取的行我用来读取数据库的查询是 string strSQL SELECT
在 MySQL 中使用字符串数据类型代替日期时间数据类型是一个好主意吗？

在 MySQL 数据库之上实现 Web 应用程序时我在想仅使用字符串数据类型来存储日期是否是一个好主意例如我可以将日期作为 201110191503999 存储到数据库中而且这样按日期查询也很方便例如 select from so
PresentationFramework.dll 中发生“System.Windows.Markup.XamlParseException”类型的未处理异常

我正在 C WPF 中开发一个小型应用程序该应用程序由串行端口的数据提供它还读取包含一些常量的文本文件以进行计算当传入数据到达时事件处理程序会对其进行处理 serialPort DataReceived new System IO
GROUP_BY 的两个 LEFT JOIN 的 GROUP_CONCAT 出现奇怪的重复行为

是我所有的表结构和查询请重点关注last查询附在下面正如你在小提琴中看到的这是电流输出 user id user name score reputation top two tags 1 Jack 0 18 css mysql 4
MsBuild 未在发布配置中生成 PDB 文件
[DllImport] 正在加载哪个 DLL？

我正在使用 DllImport 属性将本机 DLL 导入到我的应用程序中但它加载的 DLL 不在本地 bin 文件夹中它是从系统上的其他地方加载的但我不知道在哪里它可以在我的开发机器上运行但不能在干净的机器上运行我已启用 Fus
如何更新 ListView 项目中的进度条

我有一个ListView附加到一个ArrayAdapter 当用户单击某个项目的下载按钮时ListView下载开始使用DownloadManager 我想要做的是用进度条放置在项目布局中跟踪下载进度如何才能实现这一目标 Pocket
将 int64_t 转换为 double

int64 t a 1234 double d double a 这是推荐的方式吗 use static cast正如斯特雷格的回答我建议against使用隐式转换甚至 C 源代码中的 C 风格转换有以下几个原因隐式转换是编译器警告
在 Angular ui-router 中从数组对象创建状态

我可以像这样从一个对象创建一个状态 var stateTest name 2 views video templateUrl templates 2 video html controller VideoCtrl content templ
符号在 C#.NET 中的含义是什么？ [复制]

这个问题在这里已经有答案了可能的重复是什么运算符为 https stackoverflow com questions 827454 what is the operator for 我看到一行代码其中指出 return str s
如何使用解耦的 API 在单页应用程序 (SPA) 中安全地实现身份验证

我一直在研究如何最好地在单页应用程序 SPA 中存储身份验证令牌 SO 上关于这个主题存在一些争论但据我所知没有一个提供具体的解决方案昨天和今天花了很多时间在互联网上寻找答案我发现了以下内容本地存储 API 我发现一些基本指南建议
熊猫升级版

我在 Windows 机器上运行 Python 路径如下 C WinPython 64bit 3 4 4 1 我正在尝试升级到最新版本的 pandas 当前运行 0 17 1 但遇到问题我查看了以前的帖子并尝试使用命令行 c gt pip
有没有办法将 require_once() 的范围显式设置为全局？

我正在寻找一种方法来设置范围require once 到全局范围当require once 在函数内部使用像下面的代码应该可以工作文件 foo php
char * 和 char[]

为什么这是对的 include
使用 jq 删除 JSON 值中的重复项

我有以下 JSON function ping name start servers load 581 6875 last heard 2 379324197769165 version 1 0 hidden false pid 19735
参数.被调用者替代方案

As arguments callee将被弃用我将在以下表达式中使用什么来代替arguments callee var self this this async function if test then else self async
通过 JMH 测量 sun.misc.Unsafe.compareAndSwap 中的奇怪行为

我决定使用不同的锁定策略来测量增量并为此使用 JMH 我使用 JMH 来检查吞吐量和平均时间并使用简单的自定义测试来检查正确性有六种策略原子数读写锁定计数与易失性同步无易失性的同步块 sun misc Unsafe compa

通过 JMH 测量 sun.misc.Unsafe.compareAndSwap 中的奇怪行为

通过 JMH 测量 sun.misc.Unsafe.compareAndSwap 中的奇怪行为 的相关文章

随机推荐

热门标签

通过 JMH 测量 sun.misc.Unsafe.compareAndSwap 中的奇怪行为的相关文章