CAS 与同步性能

2024-01-12

我已经有这个问题很长一段时间了，试图阅读大量资源并了解正在发生的事情 - 但我仍然无法很好地理解为什么事情是这样的。

简而言之，我正在尝试测试如何CAS将执行 vssynchronized在有竞争和没有竞争的环境中。我已经把这个JMH test:

@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@Warmup(iterations = 5, time = 5, timeUnit = TimeUnit.SECONDS)
@Measurement(iterations = 5, time = 5, timeUnit = TimeUnit.SECONDS)
@State(Scope.Benchmark)
public class SandBox {

    Object lock = new Object();

    public static void main(String[] args) throws RunnerException {
        Options opt = new OptionsBuilder().include(SandBox.class.getSimpleName())
                .jvmArgs("-ea", "-Xms10g", "-Xmx10g")
                .shouldFailOnError(true)
                .build();
        new Runner(opt).run();
    }

    @State(Scope.Thread)
    public static class Holder {

        private long number;

        private AtomicLong atomicLong;

        @Setup
        public void setUp() {
            number = ThreadLocalRandom.current().nextLong();
            atomicLong = new AtomicLong(number);
        }
    }

    @Fork(1)
    @Benchmark
    public long sync(Holder holder) {
        long n = holder.number;
        synchronized (lock) {
            n = n * 123;
        }

        return n;
    }

    @Fork(1)
    @Benchmark
    public AtomicLong cas(Holder holder) {
        AtomicLong al = holder.atomicLong;
        al.updateAndGet(x -> x * 123);
        return al;
    }

    private Object anotherLock = new Object();

    private long anotherNumber = ThreadLocalRandom.current().nextLong();

    private AtomicLong anotherAl = new AtomicLong(anotherNumber);

    @Fork(1)
    @Benchmark
    public long syncShared() {
        synchronized (anotherLock) {
            anotherNumber = anotherNumber * 123;
        }

        return anotherNumber;
    }

    @Fork(1)
    @Benchmark
    public AtomicLong casShared() {
        anotherAl.updateAndGet(x -> x * 123);
        return anotherAl;
    }

    @Fork(value = 1, jvmArgsAppend = "-XX:-UseBiasedLocking")
    @Benchmark
    public long syncSharedNonBiased() {
        synchronized (anotherLock) {
            anotherNumber = anotherNumber * 123;
        }

        return anotherNumber;
    }

}

结果：

Benchmark                                           Mode  Cnt     Score      Error  Units
spinLockVsSynchronized.SandBox.cas                  avgt    5   212.922 ±   18.011  ns/op
spinLockVsSynchronized.SandBox.casShared            avgt    5  4106.764 ± 1233.108  ns/op
spinLockVsSynchronized.SandBox.sync                 avgt    5  2869.664 ±  231.482  ns/op
spinLockVsSynchronized.SandBox.syncShared           avgt    5  2414.177 ±   85.022  ns/op
spinLockVsSynchronized.SandBox.syncSharedNonBiased  avgt    5  2696.102 ±  279.734  ns/op

在非共享的情况下CASis by far更快，这是我所期望的。但在共享的情况下，事情是相反的——这是我无法理解的。我不认为这与偏向锁定有关，因为这会在线程持有锁 5 秒后发生（据我所知），而这种情况不会发生，测试只是证明。

老实说，我希望这只是我的测试是错误的，并且有人有jmh专业知识的出现会告诉我这里的设置是错误的。

主要的误解是假设您正在比较“CAS vs. synchronized”。鉴于复杂的 JVM 如何实现synchronized，您正在比较一个的性能CAS基于算法使用AtomicLong与性能CAS用于实现的基于算法synchronized.

如同Lock，对象监视器的内部信息基本上由int状态表明它是否已被拥有以及嵌套的频率，对当前所有者线程的引用以及等待能够获取它的线程队列。昂贵的方面是等待队列。将线程放入队列、将其从线程调度中删除以及最终在当前所有者释放监视器时将其唤醒，这些操作可能会花费大量时间。

然而，在无竞争的情况下，当然不涉及等待队列。采集监视器由单个CAS将状态从“无主”（通常为零）更改为“拥有，获得一次”（猜测典型值）。如果成功，线程可以继续执行关键操作，然后释放，这意味着仅写入具有必要内存可见性的“无主”状态，并唤醒另一个被阻塞的线程（如果有）。

由于等待队列的成本要高得多，因此即使在竞争情况下，实现通常也会尝试通过执行一定量的旋转来避免它，从而使多次重复CAS在回退到使线程排队之前尝试。如果所有者的关键操作就像单个乘法一样简单，那么监视器在旋转阶段就已经被释放的可能性很高。注意synchronized这是“不公平的”，允许旋转线程立即继续，即使已经有排队的线程等待更长时间。

如果您比较执行的基本操作synchronized(lock){ n = n * 123; }当不涉及排队时al.updateAndGet(x -> x * 123);，你会发现它们大致相当。主要区别在于AtomicLong方法将重复争用乘法，而对于synchronized方法中，如果在旋转期间没有取得进展，则存在被放入队列的风险。

But synchronized allows 锁粗化 https://shipilev.net/jvm-anatomy-park/1-lock-coarsening-for-loops/对于在同一对象上重复同步的代码，这可能与调用syncShared方法。除非还有一种方法可以融合多个CAS的更新AtomicLong，这可以给synchronized一个巨大的优势。（也可以看看本文 https://www.ibm.com/developerworks/library/j-jtp10185/index.html涵盖了上面讨论的几个方面）

请注意，由于“不公平”性质synchronized，创建比 CPU 核心多得多的线程不一定是问题。在最好的情况下，“线程数减去核心数”线程最终会出现在队列中，永远不会醒来，而其余线程在旋转阶段成功，每个核心上有一个线程。但同样，不在 CPU 核心上运行的线程也不会降低 CPU 的性能。AtomicLong更新，因为它们既不能使当前值对其他线程无效，也不能使失败CAS试图。

无论哪种情况，当CAS在非共享对象的成员变量上或执行时synchronized在非共享对象上，JVM 可以检测操作的本地性质并消除大部分相关成本。但这可能取决于几个微妙的环境因素。

最重要的是，在原子更新和synchronized块。通过更昂贵的操作，事情会变得更加有趣，这可能会增加线程在竞争情况下排队的可能性synchronized，这使得在原子更新的竞争情况下必须重复该操作是可以接受的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

CAS 与同步性能的相关文章

在使用 libstdc++ 进行调试期间强制使用 std::atomic 内部的锁

我用谷歌搜索了一下似乎找不到GCC选项或libstdc 库宏为此是否可以强制在所有的内部使用锁定std atomic模板专业化在某些平台上某些专业化无论如何都会锁定因此这似乎是一个可行的选择过去我发现使用std atomic使用
如何从 Java 8 中的迭代器获取第 n 个值？

我整理了一个HashMap using 按值对 Map 进行排序 Java https stackoverflow com questions 109383 sort a mapkey value by values java对此我有一个L
检测流中的重复组

我想确保列表中的所有数字都分组在一起让我用例子来解释这一点 1 1 1 2 2 OK two distinct groups 1 1 2 2 1 1 Bad two groups with 1 1 2 3 4 OK 4 distinct
JDK 8 中的默认值是 Java 中多重继承的一种形式吗？

JDK 8 中的一项新功能允许您添加到现有接口同时保留二进制兼容性语法就像 public interface SomeInterface void existingInterface void newInterface default
使用 lambda 内联过滤避免意外 null

我有每个元素的列表我想这样做使用Java 8 disabledUsersOnLDAP stream forEach user gt usersRepository findEnabledByUsername user getUserNa
在 Java 8 中，如何使用 lambda 将 Map 转换为另一个 Map？

我刚刚开始研究 Java 8 并尝试 lambda 我想我应该尝试重写我最近写的一个非常简单的东西我需要将字符串到列的映射转换为另一个字符串到列的映射其中新映射中的列是第一个映射中的列的防御副本列有一个复制构造函数到目前为止我最接近
Java 8 Spliterator 中使用的奇怪循环[重复]

这个问题在这里已经有答案了有谁知道为什么java util Spliterator当循环体为空时实现使用 do while 而不是 while 循环例如实施forEachRemaining is default void forEa
使用Optional验证输入

我有一个 CreateOrder 实例其中包含一些 String Integer 和 Double 状态当我在 JUnit 测试中为 CreateOrder 创建一个对象并将其发送出去时我可以使用可选 API 验证 String 属性
std::atomic 是否会阻止非原子变量对原子变量进行重新排序

问题很简单问如果我有 settings N STNGS used by many threads std atomic
为什么以下带有循环泛型的代码无法编译？

以下是我的代码 class A
如何使用 lambda 表达式调试stream().map(...)？

在我们的项目中我们正在迁移到 java 8 并且正在测试它的新功能在我的项目中我使用 Guava 谓词和函数来过滤和转换一些集合Collections2 transform and Collections2 filter 在这次迁移中
如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？

我花了几个小时来挖掘这种行为首先是关于这些问题 write 2 到本地文件系统的原子性 https stackoverflow com questions 10650861 atomicity of write2 to a local f
将列表沿元素拆分为子列表

我有这个清单 List
使用祖父母接口的默认方法

我完全不明白为什么这行不通 interface Test default void doMagic System out println Abracadabra class TestImpl implements Test class Sp
java中的比较器链

正在阅读Oracle 关于接口的 Java 教程 https docs oracle com javase tutorial java IandI createinterface html其中给出了一个例子Card 打牌我试图理解接口中的
Java8 lambda 是否像匿名类一样维护对其封闭实例的引用？

We know https stackoverflow com questions 5054360 do anonymous classes always maintain a reference to their enclosing in
在不支持 CAS 操作的处理器上进行 CompareAndSet

今天我在一次采访中被问到下一个问题如果您在具有不支持 CAS 操作的处理器的机器上调用 AtomicLong 的compareAndSet 方法会发生什么情况您能否帮我解决这个问题并在可能的情况下提供一些全面描述的链接 From
Java 8 Stream，获取头部和尾部

Java 8 引入了Stream http download java net jdk8 docs api java util stream Stream html类似于 Scala 的类Stream http www scala lang
Java 8 中 Map.Entry 的 Comparator.comparing [重复]

这个问题在这里已经有答案了给出以下代码 Test public void test7 Map
嵌套字段的 Comparator.comparing(...)

假设我有一个这样的域模型 class Lecture Course course getters class Course Teacher teacher int studentSize getters class Teacher int

随机推荐

jekyll：检查是否没有帖子

如何查看帖子里是否没有帖子 posts folder 到目前为止我已经尝试过 if site posts null p No posts yet p endif and if site posts nil p No posts yet p
从 VB 转换为 C#

我的任务是将解决方案从 VB 转换为 C 有 22 个项目和数百个类所以我决定研究转换器我最终选择了 SharpDevelop 这是一个带有转换器的 IDE 我在每个项目上都运行了它并且有很多错误需要修复但我应该能够检查它们并希望找
Sequelize 增量函数返回错误

尝试增加我的数据库中模型实例的整数字段这是相关代码 models Options findAll where PollId poll id name option to update then option gt option incre
删除网址中的主题标签，刷新 f5 时出错（angularJs-cordova）

我对 AngularJs 中的路由器有一些疑问我使用了 Angular UI Router 但是当使用 locationProvider 删除 url 中的主题标签时出现错误如何解决这个问题在我的模块中 config functio
使用 JNI 从 C++ 调用 JAVA 方法，无参数

请耐心听我说我是一名 iPhone 开发人员而整个 Android 这让我有点困惑我有一些从 cocos2d x CCMenuItem 调用的 C 方法因此根据文档我无法发送任何参数我需要使用 android 浏览器打开一个
CSS 箭头在 jQuery SlideUp 或 SlideDown 动画期间隐藏

我有一个使用 CSS 创建的顶部带有箭头的 div arrow box position relative display none background 88b7d5 border 4px solid c2e1f5 padding 20p
在 ExtJS 中，如何循环菜单项？

如何循环遍历 ExtJS 工具栏菜单中的所有项目例如更改其图标使用 each 方法混合系列 http dev sencha com deploy dev docs class Ext util MixedCollection按钮菜单中的
为什么 XmlDocument.LoadXml 抛出 System.Net.WebException？

为什么System Xml XmlDocument LoadXml方法抛出System Net WebException 这真是令人难以置信的疯狂如果MSDN http msdn microsoft com en us library s
python 中的专用 @property 装饰器

我有几个类每个类都有许多属性所有属性的共同点是它们应该是数字属性这似乎是使用 python 装饰器的理想场所但我似乎无法完全理解正确的实现是什么这是一个简单的例子 class Junk object def init self v
在 VSCode 中包含 d.ts 类型定义文件

我已经开始使用 VSCode 0 7 0 并注意到注释说你不必添加不再参考引入 jsconfig json 后您不再需要在每个文件中使用引用这些在 VS Code 的初始版本中是必需的由于文件集是在 jsconfig json
python Anaconda 中的 Mayavi

我安装了mayavi在 Anaconda 中使用命令 conda exe install mayavi 在 Anaconda 命令提示符中现在当我关闭 Spyder 时它就不再打开了我该如何解决我正在使用Windows 我想展示我
如何避免Python API服务器中的重复处理？ [复制]

这个问题在这里已经有答案了假设一个函数detect primes调用起来很昂贵我想避免使用重复的参数重复调用它我应该怎么办使用缓存没有帮助因为该函数可能会在不同的请求中同时调用当两个请求都将缓存视为空值时两个请求都将继续执行昂
C++ 中的句柄是什么？

有人告诉我句柄有点像指针但其实不是它允许您保留对对象的引用而不是对象本身更详细的解释是什么句柄可以是从整数索引到指向内核空间中资源的指针的任何内容其想法是它们提供了资源的抽象因此您无需了解太多有关资源本身的信息即可使用它
直接在 Excel 工作表上使用 ActiveX 控件的必要和充分要求是什么？

Microsoft Office 支持文章添加或注册 ActiveX 控件 https support office com en us article Add or register an ActiveX control 8fc743a
枚举和 android 注释 intDef

我有一个枚举 public enum AppEnums SERVICE ERROR CONNECTION ERROR 我想在 Android 注释的 intDef 中使用它 IntDef AppEnums CONNECTION ERROR
在 Kotlin 中实例化对象时如何重写方法？

在Java中要在实例化新对象时重写方法我们可以这样做 public ActivityTestRule
如何在从 Flutter 创建文档到 Firestore 时添加时间戳 [重复]

这个问题在这里已经有答案了我正在编写代码以将数据从 flutter 设置到 Firestore 我想要的是添加一个用于创建数据的时间的字段例如 createdOn Flutter 的 DateTime now 从设备获取时间但我想获取
简单的Java“新”概念问题

编译器显示错误new Stock 2 after expect public class TestStockUI Stock stock new Stock 2 stock 0 new Stock Microsoft MSFT 15 69
如何在 SQL Server 2008 上找到禁用的索引

不久前当我向 SQL Server 数据库中执行一些批量数据插入时我禁用了许多索引以提高插入性能我现在需要返回并重建重新启用它们不幸的是我不确定我禁用了哪些索引有没有办法可以查询以确定哪些索引被禁用并且应该重新启用 selec
CAS 与同步性能

我已经有这个问题很长一段时间了试图阅读大量资源并了解正在发生的事情但我仍然无法很好地理解为什么事情是这样的简而言之我正在尝试测试如何CAS将执行 vssynchronized在有竞争和没有竞争的环境中我已经把这个JMH test

CAS 与同步性能

CAS 与同步性能 的相关文章

随机推荐

热门标签

CAS 与同步性能的相关文章