实现一个类似于 Qt 的高性能互斥体

2024-03-19

我有一个多线程科学应用程序，其中多个计算线程（每个核心一个）必须将其结果存储在公共缓冲区中。这就需要互斥机制。

工作线程只花费一小部分时间写入缓冲区，因此互斥锁在大多数时间都处于解锁状态，并且锁定很有可能立即成功，而无需等待另一个线程解锁。

目前，我已经使用 Qt 的 QMutex 来完成该任务，并且效果很好：互斥体的开销可以忽略不计。

但是，我必须将其仅移植到 c++11/STL。使用 std::mutex 时，性能下降 66%，并且线程大部分时间都在锁定互斥体。

在另一个问题之后，我认为 Qt 使用基于简单原子标志的快速锁定机制，针对互斥锁尚未锁定的情况进行了优化。当发生并发锁定时，会回退到系统互斥体。

我想用STL来实现这个。有没有一种基于 std::atomic 和 std::mutex 的简单方法？我已经深入研究了 Qt 的代码，但它对我的使用来说似乎过于复杂（我不需要锁超时、pimpl、小占用空间等......）。

编辑：我尝试过自旋锁，但这效果不佳，因为：

另一个线程会定期（每隔几秒）锁定互斥体并刷新缓冲区。这需要一些时间，因此所有工作线程此时都会被阻塞。自旋锁使调度变得繁忙，导致刷新速度比使用适当的互斥锁慢 10-100 倍。这是不可接受的

编辑：我已经尝试过这个，但它不起作用（锁定所有线程）

class Mutex
{
public:
    Mutex() : lockCounter(0) { }

    void lock()
    {
        if(lockCounter.fetch_add(1, std::memory_order_acquire)>0)
        {
            std::unique_lock<std::mutex> lock(internalMutex);
            cv.wait(lock);
        }
    }

    void unlock();
    {
        if(lockCounter.fetch_sub(1, std::memory_order_release)>1)
        {
            cv.notify_one();
        }
    }


private:
    std::atomic<int> lockCounter;
    std::mutex internalMutex;
    std::condition_variable cv;
};

Thanks!

编辑：最终解决方案

MikeMB 的快速互斥体运行得很好。

作为最终的解决方案，我做了：

使用带有 try_lock 的简单自旋锁
当一个线程尝试锁定失败时，它们不会等待，而是填充一个队列（不与其他线程共享）并继续
当线程获得锁时，它会使用当前结果以及队列中存储的结果更新缓冲区（它处理其队列）
缓冲区刷新变得更加高效：阻塞部分仅交换两个指针。

一般建议

正如一些评论中提到的，我首先看看您是否可以重构您的程序设计，以使互斥体实现对您的性能不再那么重要。
此外，由于标准 C++ 中的多线程支持相当新，而且有些幼稚，因此有时您只需要依靠特定于平台的机制，例如AfutexLinux 系统上的关键部分或 Windows 上的关键部分或 Qt 等非标准库。
话虽这么说，我可以想到两种可能加速你的程序的实现方法：

Spinlock
如果访问冲突很少发生，并且互斥锁仅保留很短的时间（当然，无论如何我们都应该努力实现这两件事），那么仅使用自旋锁可能是最有效的，因为它不需要任何系统完全调用并且实现起来很简单（取自参考参数 http://en.cppreference.com/w/cpp/atomic/atomic_flag):

class SpinLock {
    std::atomic_flag locked ;
public:
    void lock() {
        while (locked.test_and_set(std::memory_order_acquire)) { 
             std::this_thread::yield(); //<- this is not in the source but might improve performance. 
        }
    }
    void unlock() {
        locked.clear(std::memory_order_release);
    }
};

当然，缺点是等待线程不会保持睡眠状态并窃取处理时间。

检查锁定

这本质上就是您演示的想法：您首先进行快速检查，基于原子交换操作是否确实需要锁定，并使用重型std::mutex仅当它不可避免时。

struct FastMux {
    //Status of the fast mutex
    std::atomic<bool> locked;
    //helper mutex and vc on which threads can wait in case of collision
    std::mutex mux;
    std::condition_variable cv;
    //the maximum number of threads that might be waiting on the cv (conservative estimation)
    std::atomic<int> cntr; 

    FastMux():locked(false), cntr(0){}

    void lock() {
        if (locked.exchange(true)) {
            cntr++;
            {
                std::unique_lock<std::mutex> ul(mux);
                cv.wait(ul, [&]{return !locked.exchange(true); });
            }
            cntr--;
        }
    }
    void unlock() {
        locked = false;
        if (cntr > 0){
            std::lock_guard<std::mutex> ul(mux);
            cv.notify_one();
        }
    }
};

请注意，std::mutex没有被锁定在中间lock() and unlock()但它仅用于处理条件变量。如果互斥锁上存在严重拥塞，这会导致更多的锁定/解锁调用。

您的实施的问题是cv.notify_one();可以在之间调用if(lockCounter.fetch_add(1, std::memory_order_acquire)>0) and cv.wait(lock);所以你的线程可能永远不会醒来。

不过，我没有与您建议的实现的固定版本进行任何性能比较，因此您只需看看什么最适合您。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

实现一个类似于 Qt 的高性能互斥体的相关文章

快速 log2(float x) 实现 C++

我需要在 C 中非常快速地实现 log2 float x 函数我发现了一个非常有趣的实现而且速度非常快 include
Xamarin 测试记录器选项有错误。无法记录自动化测试

选项 gt Xamarin gt Xamarin Test Recorder 中的所有设置都有错误我的桌面上安装了 Visual Studio 2015 企业版以及 Xamarin 和 Xamarin Test Recorder 插件
ASP.NET 如何在 Web API 中读取多部分表单数据？

我将多部分表单数据发送到我的 Web API 如下所示 string example my string HttpContent stringContent new StringContent example HttpContent fil
这种对有效类型规则的使用是否严格遵守？

C99和C11中的有效类型规则规定没有声明类型的存储可以用任何类型写入并且存储非字符类型的值将相应地设置存储的有效类型抛开 INT MAX 可能小于 123456789 的事实不谈以下代码对有效类型规则的使用是否严格符合 inclu
如何进行Visual Studio格式字典初始化？

所有 Visual Studio 也包括 2012 不格式化以下内容 messageProcessor new Dictionary
如何使用 libclang 判断成员函数是 const 还是 volatile？

我有一个实例CXCursor同类CXCursor CXXMethod 我想知道这个函数是否是const or volatile 例如 class Foo public void bar const void baz volatile voi
如何在 C# 中创建 PKCS12 .p12 文件？

这可能是一个n00b问题但我在这方面确实没有任何经验我需要创建一个包含 X509 证书和私钥的 p12 捆绑包我当前有两个对象 X509Certificate2 和包含关键信息的 RSAParameters 对象如何将它们合并到 p
如何检查给定调用站点的重载决策集

如何检查重载解析集我在多个调用站点中使用了 4 个相互竞争的函数在一个调用站点中我期望调用一个函数但编译器会选择另一个函数我不知道为什么这不是微不足道的为了了解发生了什么我正在使用enable if disable if打开
WPF ComboBox 中具有本地化名称的枚举

我有一个列出枚举的组合框 enum StatusEnum Open 1 Closed 2 InProgress 3
哪个更快？按引用传递与按值传递 C++

我认为按引用传递应该比按值传递更快因为计算机不复制数据它只是指向数据的地址但是请考虑以下 C 代码 include
指向 VLA 的指针

你可能知道 VLA 的优点和缺点 https stackoverflow com a 3082302 1606345在 C11 中它们是可选的我认为使 VLA 成为可选的主要原因是堆栈可能会爆炸 int arr n where n 10
Bazel：将编译标志添加到默认 C++ 工具链

我想向默认的 C 工具链添加一些编译器和链接器标志以便我构建的所有目标本地或导入共享它们我知道可以定义我自己的工具链但我不想这样做因为它非常复杂且容易出错理想情况下我想要这样的东西 cc toolchain cc defaul
多个包含带有变量定义的头文件

我只是构建一个简单的 C 项目代码如下所示 head h ifndef HEAD H define HEAD H int my var 100 endif src1 cpp include head h src2 cpp include
PowerShell 与 MongoDB C# 驱动程序方法不兼容？

由 C 泛型引起的最新 MongoDB 驱动程序的问题 Cannot find an overload for GetCollection and the argument count 1 我可能可以使用其他没有泛型的 GetCollect
为什么将未使用的返回值转换为 void？

int fn void whatever void fn 是否有任何理由将未使用的返回值强制转换为 void 或者我认为这完全是浪费时间 David s answer https stackoverflow com questions 68
OpenSSL：无需 SSL_read() / SSL_write() 即可执行加密/解密

我已经用 C 语言编写了一个基于事件的网络库现在我想通过 OpenSSL 添加 SSL TLS 支持而不是使用SSL read and SSL write 我宁愿让 OpenSSL 只执行传出传入数据的加密解密让我自己传输接收数
当 QML 对象不可见时防止 QML 属性绑定？

我正在开发一个具有大量属性绑定的 QML 应用程序数百个对象被跟踪并以不同的形式显示例如 Qt3D QCanvas 当我在应用程序的单独页面上时 x y 位置和相对大小的属性绑定仍在发生我怎样才能阻止他们我知道我可以根据属性是否可视
Cordova 上的 ClearCookiesAsync()

我正在尝试使用 wp8 cordova 中的插件来清除 WebBrowser cookie 我已经让它与 JavaScript 进行通信并且我的 c 文件中有类似这样的内容 using WPCordovaClassLib Cordova
使用 ImageResizer 获取图像尺寸的最佳方法

我正在将现有的 MVC 4 网站从自制用户文件上传切换为在上传时使用 ImageResizer 调整文件大小我在文档中看到我不应该使用 System Drawing 但我无法找出任何其他获取图像尺寸的方法尺寸是来自原始图像还是调整大小的
C#“var”关键字在 VB.NET 中的等价物是什么？

例如我如何获得 VB NET静态类型局部变量是static赋值右侧的表达式的类型像这样 Dim http msdn microsoft com en us library 7ee5a7s1 aspx我的变量 3 你还需要选项推断 ht

随机推荐

Mathematica 下调 Lhs 值

有谁知道 Mathematica 中是否有一个内置函数可以获取 downvalue 规则的 lhs 没有任何保留我知道如何编写代码来做到这一点但这对于内置程序来说似乎已经足够基本了例如 a 1 2 a 2 3 BuiltInIDoNo
Xcode 构建和运行错误：“进程启动失败：无法获取进程 216 的任务”

更新到 Mavericks 并确保我也安装了 Xcode 的最新更新后 Xcode 突然无法在设备上启动应用程序它会在我的 iPhone 上安装该应用程序但在运行之前会抛出以下错误进程启动失败无法获取进程 216 的任务这是更新后
Docker 中的 PostgreSQL - pg_hba.conf 允许从主机访问容器

我想在 Docker 容器内运行 PostgreSQL 我正在构建自己的 Docker 镜像因为我想包含 PostgreSQL 扩展我应该编辑pg hba conf配置文件到允许来自其他容器的访问允许来自主机的访问第一个非常简单
无法读取未定义的属性“标签”

我刚刚学习 Chart js 的工作原理因此我直接使用了 Chart js API 页面上的示例代码但它似乎不起作用我将以下代码放入脚本标记中并收到无法读取未定义的属性标签错误不确定这个错误意味着什么 function va
从通用约束 Dart 调用静态方法

我正在尝试从收到的泛型类型中调用静态方法这可能吗此外我应用了类型约束以便仅从其父类操作该对象这是我想要实现的目标的一个简短示例 class A static func print A class B extends A stati
WS-Security 不适用于 CXF

我正在尝试使用 Apache CXF 开发支持 WS 安全的 Web 服务我正在遵循的教程是here http www benmccann com blog apache cxf tutorial ws security with spr
jQuery getJSON 请求在有效请求上返回空

我正在尝试从 Apple 的 iTunes JSON 服务获取一些 JSON 请求很简单如果您在浏览器中访问该 URL 您将看到一些格式良好由 jsonlint com 支持的 JSON 然而当我使用以下 jQuery 发出请求时
使用 Web Api 2 Angular 下载 csv 文件

我正在尝试使用 web api 2 和 Angular js 下载 csv 文件这是我的控制器代码 public IHttpActionResult ExportCsvData var stream new FileStream Test
使用 hashmap 时什么时候需要重写 hashcode() 和 equals() [重复]

这个问题在这里已经有答案了我现在在这个问题上挣扎了一段时间我知道如果您使用哈希集如果您处理的对象与 String 不同我猜相同的字符串具有相同的哈希码则必须覆盖 hashcode 和 equals 并选择要考虑的属性因此对象是
为什么 PHP DOMDocument loadHTML 不适用于波斯语字符？

这是我的代码 https 3v4l org DqZKu
如何以粉丝专页而非用户身份发布到 Facebook 粉丝专页

我怎样才能以粉丝页面而不是用户的身份在粉丝专页墙上发帖使用 javascript sdk 现在在 Init 上我正在接收 menage pages 并获取合适的 fanpage id 我如何更改下面的调用 var target param
vue-test-utils：无法覆盖属性 $route，这通常是由将该属性添加为只读值的插件引起的

我看过有关此问题的其他答案这似乎是由于尝试导入引起的vue router进入测试然而我的问题并非如此这是我的测试代码 import mount shallowMount createLocalVue from vue test ut
在同一 jvm 中部署的多个 war 中使用 cassandra 驱动程序时出现 jmx 错误

我将 app1 war 和 app2 war 部署在同一个 tomcat jvm 中两个应用程序都有自己的上下文 xml app1 xml 和 app2 xml 这两个应用程序都包含连接到 Cassandra 的 datastax 驱动程
具有良好字符串操作支持的嵌入式语言

我一直在开发一个 C 程序该程序执行大量字符串操作并且经常需要调整和重新编译以进行某种特殊情况处理我一直认为嵌入一些具有良好字符串操作支持的脚本语言可能对该项目有意义什么语言可以提供最好的字符串操作支持同时又可以轻松嵌入到 C 程
如何在 Visual Studio 2010 中使用 C# 创建简单的 SOAP 服务器？

我试图按照说明进行操作here http msdn microsoft com en us library ms464040 aspx但随着他们的进一步发展他们似乎很快就变得非常具体于 Sharepoint 我只想要一个创建非共享点 SO
Apple Vision – 条形码检测不适用于不同颜色的条形码

所以我必须扫描不同颜色的不同条形码例如黑底黄色条形码或白底黄色条形码我对传统线性和 CCD 条码扫描仪识别它们没有任何问题我尝试过使用 Apple Vision 框架但它对它们不起作用它们在白色背景的黑色条形码上工作得非常好
无法将 cuda:0 设备类型张量转换为 numpy。首先使用 Tensor.cpu() 将张量复制到主机内存

我试图展示 GAN 网络在某些指定时期的结果打印当前结果的功能之前是在 TF 中使用的我需要换成pytorch def show result G net z num epoch show False save False path r
从 jar-with-dependencies 构建的 jar 中排除文件

My pom xml包含以下内容来创建具有所有依赖项的项目的 jar 现在我有一个属性文件src main resources这是运行应用程序所必需的我想从 IDE 开始使用它但我不想将其发送到创建的 jar 文件中因为设置是单独维护
Prolog 中的分配性检查

假设我有一个等价关系eq 以及多个二元运算符o 1 o 2 o n 我想找出哪些操作分配给其他操作假设我有一个可以确定两个表达式是否等价的知识库一个简单的解决方案是输入所有可能的查询对于左分配性 eq o 1 Z o 1 X Y o
实现一个类似于 Qt 的高性能互斥体

我有一个多线程科学应用程序其中多个计算线程每个核心一个必须将其结果存储在公共缓冲区中这就需要互斥机制工作线程只花费一小部分时间写入缓冲区因此互斥锁在大多数时间都处于解锁状态并且锁定很有可能立即成功而无需等待另一个线程解锁目

实现一个类似于 Qt 的高性能互斥体

实现一个类似于 Qt 的高性能互斥体 的相关文章

随机推荐

热门标签

实现一个类似于 Qt 的高性能互斥体的相关文章