std::mutex 性能与 win32 CRITICAL_SECTION 相比

2024-01-02

的表现如何std::mutex相比CRITICAL_SECTION？是同等水平吗？

我需要轻量级同步对象（不需要是进程间对象）是否有任何接近的STL类CRITICAL_SECTION以外std::mutex ?

请参阅我在答案末尾的更新，自 Visual Studio 2015 以来情况发生了巨大变化。原始答案如下。

我做了一个非常简单的测试，根据我的测量std::mutex大约慢 50-70 倍CRITICAL_SECTION.

std::mutex:       18140574us
CRITICAL_SECTION: 296874us

编辑：经过更多测试后发现它取决于线程数（拥塞）和 CPU 核心数。一般来说，std::mutex速度慢一些，但是慢多少，要看使用情况。以下是更新的测试结果（在配备 Core i5-4258U 的 MacBook Pro、Windows 10、Bootcamp 上测试）：

Iterations: 1000000
Thread count: 1
std::mutex:       78132us
CRITICAL_SECTION: 31252us
Thread count: 2
std::mutex:       687538us
CRITICAL_SECTION: 140648us
Thread count: 4
std::mutex:       1031277us
CRITICAL_SECTION: 703180us
Thread count: 8
std::mutex:       86779418us
CRITICAL_SECTION: 1634123us
Thread count: 16
std::mutex:       172916124us
CRITICAL_SECTION: 3390895us

以下是产生此输出的代码。使用Visual Studio 2012编译，默认项目设置，Win32发布配置。请注意，这个测试可能并不完全正确，但它让我在从使用代码切换代码之前三思而后行CRITICAL_SECTION to std::mutex.

#include "stdafx.h"
#include <Windows.h>
#include <mutex>
#include <thread>
#include <vector>
#include <chrono>
#include <iostream>

const int g_cRepeatCount = 1000000;
const int g_cThreadCount = 16;

double g_shmem = 8;
std::mutex g_mutex;
CRITICAL_SECTION g_critSec;

void sharedFunc( int i )
{
    if ( i % 2 == 0 )
        g_shmem = sqrt(g_shmem);
    else
        g_shmem *= g_shmem;
}

void threadFuncCritSec() {
    for ( int i = 0; i < g_cRepeatCount; ++i ) {
        EnterCriticalSection( &g_critSec );
        sharedFunc(i);
        LeaveCriticalSection( &g_critSec );
    }
}

void threadFuncMutex() {
    for ( int i = 0; i < g_cRepeatCount; ++i ) {
        g_mutex.lock();
        sharedFunc(i);
        g_mutex.unlock();
    }
}

void testRound(int threadCount)
{
    std::vector<std::thread> threads;

    auto startMutex = std::chrono::high_resolution_clock::now();
    for (int i = 0; i<threadCount; ++i)
        threads.push_back(std::thread( threadFuncMutex ));
    for ( std::thread& thd : threads )
        thd.join();
    auto endMutex = std::chrono::high_resolution_clock::now();

    std::cout << "std::mutex:       ";
    std::cout << std::chrono::duration_cast<std::chrono::microseconds>(endMutex - startMutex).count();
    std::cout << "us \n\r";

    threads.clear();
    auto startCritSec = std::chrono::high_resolution_clock::now();
    for (int i = 0; i<threadCount; ++i)
        threads.push_back(std::thread( threadFuncCritSec ));
    for ( std::thread& thd : threads )
        thd.join();
    auto endCritSec = std::chrono::high_resolution_clock::now();

    std::cout << "CRITICAL_SECTION: ";
    std::cout << std::chrono::duration_cast<std::chrono::microseconds>(endCritSec - startCritSec).count();
    std::cout << "us \n\r";
}

int _tmain(int argc, _TCHAR* argv[]) {
    InitializeCriticalSection( &g_critSec );

    std::cout << "Iterations: " << g_cRepeatCount << "\n\r";

    for (int i = 1; i <= g_cThreadCount; i = i*2) {
        std::cout << "Thread count: " << i << "\n\r";
        testRound(i);
        Sleep(1000);
    }

    DeleteCriticalSection( &g_critSec );

    // Added 10/27/2017 to try to prevent the compiler to completely
    // optimize out the code around g_shmem if it wouldn't be used anywhere.
    std::cout << "Shared variable value: " << g_shmem << std::endl;
    getchar();
    return 0;
}

更新 10/27/2017 (1)：一些答案表明这不是一个现实的测试或不代表“现实世界”的场景。确实如此，这个测试试图衡量overhead of the std::mutex，它并不是试图证明对于 99% 的应用程序来说差异可以忽略不计。

更新日期 10/27/2017 (2)：看来情况已经发生了有利于std::mutex自 Visual Studio 2015 (VC140) 起。我使用 VS2017 IDE，与上面完全相同的代码，x64 发布配置，禁用优化，我只是为每个测试切换了“平台工具集”。结果非常令人惊讶，我真的很好奇VC140中挂了什么。

更新 02/25/2020 (3)：使用Visual Studio 2019（Toolset v142）重新运行测试，情况仍然相同：std::mutex比速度快两到三倍CRITICAL_SECTION.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

std::mutex 性能与 win32 CRITICAL_SECTION 相比的相关文章

如何从该 Voronoi 图数据中获取单元格字典？

使用找到的voronoi delaunay图生成库在这个节目中 http sourceforge net projects mapmanager 这是基于财富最初的实施他的算法 http en wikipedia org wiki Fo
用 C# 启动 Windows 服务

我想启动一个刚刚安装的Windows服务 ServiceBase ServicesToRun if bool Parse System Configuration ConfigurationManager AppSettings RunSe
C++ 模板中的名称查找

我有一些 C 代码如果没有 fpermissive 选项就无法再编译这是我无法分享的专有代码但我认为我已经能够提取一个简单的测试用例来演示该问题这是 g 的输出 template eg cpp In instantiation o
将指针转换为浮点数？

我有一个unsigned char 通常这指向一块数据但在某些情况下指针就是数据即铸造一个int的价值unsigned char 指针 unsigned char intData unsigned char myInteger 反
泛型与接口的实际优势

在这种情况下使用泛型与接口的实际优势是什么 void MyMethod IFoo f void MyMethod
C++ 中的单例和抽象基类

最近我遇到了关于实现 Singleton 但涉及抽象基类的问题假设我们有这样的类层次结构 class IFoo it s ABC class Foo public IFoo 我们的单例类定义如下 template
避免集合已修改错误

Issue 我有以下代码 foreach var ItemA in GenericListInstanceB ItemA MethodThatCouldRemoveAnyItemInGenericListInstanceB 显然我得到一个错
如何“杀死”Pthread？

我正在学习 Pthreads 并且想知道杀死这样一个对象的最佳方法是什么在寻找类似的问题后我无法找到明确的答案但请随时向我指出任何相关问题我正在使用一个小型客户端服务器应用程序其中服务器主线程正在侦听套接字上的客户端连接每次
有没有办法使 C90 标准中的枚举无符号？（符合 MISRA-C 2004 标准）

我正在尝试找到一种使枚举无符号的方法 enum x1 0 x2 x3 uint8 t x2 lt PC LINT MISRA C 2004 will complain about mixing signed and unsigned h
如何在 C++ 中对静态缓冲区执行字符串格式化？

我正在处理一段对性能要求非常高的代码我需要执行一些格式化的字符串操作但我试图避免内存分配甚至是内部库的内存分配在过去我会做类似以下的事情假设是 C 11 constexpr int BUFFER SIZE 200 char bu
如何防止字符串被截留

我的理解可能是错误的是在 C 中当你创建一个字符串时它会被实习到实习生池中这保留了对字符串的引用以便多个相同的字符串可以共享操作内存但是我正在处理很多很可能是唯一的字符串一旦完成每个字符串我需要将它们从操作内存中完
替换 JSON 中的转义字符

我想用空格替换 JSON 字符串中的字符我怎样才能做到这一点我发现从 JSON 字符串中删除所有转义字符的最简单最好的方法是将字符串传递到正则表达式 Unescape 方法此方法返回一个没有转义字符的新字符串甚至删除了 n t
如何用C++解析复杂的字符串？

我试图弄清楚如何使用解析这个字符串sstream 和C 其格式为 string int int 我需要能够将包含 IP 地址的字符串的第一部分分配给 std string 以下是该字符串的示例 std string 127 0 0 1 1
为什么C++变量是指针时不需要正确定义？

我对 C 语言完全陌生特别是指针经验主要是 PHP 并且希望对以下内容进行一些解释我已经尝试寻找答案这两行代码如何能够在我的程序中完成完全相同的工作第二行似乎违背了我迄今为止所学到和理解的关于指针的一切 char disk 3 D
C# 的空条件委托调用线程安全吗？ [复制]

这个问题在这里已经有答案了这就是我一直以来编写事件引发者的方式例如属性更改 public event PropertyChangedEventHandler PropertyChanged private void RaisePrope
Active Directory UserPrincipal.Current.GetGroups() 返回本地组而不是 Web 服务器上的组

以下内容在我的本地开发盒上效果很好但是当我将其移动到网络服务器时它失败了甚至不会记录错误 public static List
为什么 std::ranges::filter_view 对象必须是非常量才能查询其元素？

include
C 中什么函数可以替换字符串中的子字符串？

给定一个 char 字符串我想查找所有出现的子字符串并将其替换为备用字符串我没有看到任何简单的函数可以实现这一点
编译器可以报告未知属性的错误吗？即使有范围？

在N3291 7 6 1 3 5 属性语法和语义 decl attr grammar 关于如何属性是用我读过的源代码写的使用一个属性范围令牌是有条件支持的实现定义的行为 and For an 属性标记本国际标准中未指定该行为是实现定义
致命错误 C1001：编译器中发生内部错误（编译器文件“msc1.cpp”，第 1325 行）

当我编译代码时错误指向以下类该错误在两行上突出显示如下所示 tm validFrom tm validUntil struct t SslCertData final struct t Contact TCHAR Organizati

随机推荐

定义常量变量的最佳方法是什么 python 3 [重复]

这个问题在这里已经有答案了我正在用 python 编写一个程序其中包含许多常量变量我想创建一个文件来保存所有这些变量例如 h文件输入C其中包含许多 define 我尝试使用配置解析器 https docs python org 3
从 XElement 中删除属性

我正在尝试从 xml 文档中删除一些属性这是我尝试过的 private void RemoveEmptyNamespace XElement element foreach XElement el in element Elements
为什么 to_json 在 Rails 4 中自动转义 unicode？

Rails 3 a gt br to json gt a br Rails 4 a gt br to json gt a u003Cbr u003E WHY 它似乎导致了错误 Encoding UndefinedConversionErro
在 Polars 中轻松将字符串列转换为 pl.datetime

考虑一个带有一列的 Polars 数据框str表示日期格式的类型 27 July 2020 我想将此列转换为polars datetime类型与Python标准不同datetime 以下代码使用标准datetime格式有效但 Pola
为什么在将控制台窗口设置为 WPF 应用程序的父级后，我无法与它交互？

与我相关的先前的问题 https stackoverflow com questions 54811209 is it possible to create a console window as created by allocconso
C# 内部 VS VBNET Friend

对于这个问题 C 中的朋友相当于什么 https stackoverflow com questions 204739 what is the c equivalent of friend 我个人会回答内部就像 Ja 在答案中所做的那样
native-mt 和普通 kotlin 协程库有什么区别？

当我们使用协程时我们可以使用普通的 kotlin 协程也可以使用native mt版本 i e implementation org jetbrains kotlinx kotlinx coroutines core 1 5 0 or
如何在 Tkinter 中更改框架的背景？

我一直在创建一个Email使用 Python 3 3 中的 Tkinter 进行程序在各个网站上我看到框架小部件可以使用以下命令获得不同的背景Frame config background color 但是当我在框架中使用它时会出现
为什么动态数组必须以几何方式增加其容量才能获得 O(1) 摊销推回时间复杂度？

我了解到动态数组例如std vector 当其容量达到时其容量加倍使push back操作 O 1 摊销时间然而为什么首先需要这样做呢没有为末尾的一个元素分配空间vector并复制新元素已经O 1 了如果您想在数组末尾分配空间
安卓加密

我正在开发一个 Android 应用程序我需要在其一方面使用加密我对使用哪种算法 AES DES RSA 等并不关心我知道Java有一个crypto包但我根本不熟悉它有人可以发布一个有关如何执行加密解密功能的示例吗 The j
Visual Studio 2015 中的 SQL Server 数据工具

我正在尝试创建一个 SSIS 包以将 xml 数据文件导入到 sql server 表中我在 Windows 10 机器上有 sql server 2008 R2 和 Visual Studio Professional 2015 在VS
Silverlight 和 ObservableCollection：在 UI 线程上提高 CollectionChanged

我需要在 UI 线程上引发 ObservableCollection 的 CollectionChanged 事件我见过不同的方法从包装类到相关接口的自定义实现是否有任何简单的方法可以覆盖 ObservableCollection 上
错误：libvpx 解码器版本必须 >=0.9.1 [已关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案嘿嘿我正在尝试使用以下教程在我的服务器上安装 ffmpeg https ffmpeg org trac ffmpeg wiki UbuntuComp
使用网络服务获取课程内容

我正在使用 Moodle 3 1 我正在尝试使用网络服务获取课程内容我创建了一个包含活动课程的课程现在当我尝试使用网络服务 core course get contents 获取课程内容时我收到以下响应 id 36 name 0
如何在多重调度中使用默认参数？

我使用默认参数重载函数multipledispatch 基于这个答案 https stackoverflow com a 29091980 5168011 from multipledispatch import dispatch clas
python 中的分段线性回归

Is there a library in python to do segmented linear regression http en wikipedia org wiki Segmented regression I d like
如何在猫鼬中搜索和替换？

我的目标我想更新某个路径中集合中的多个文档条件是路径与正则表达式匹配然后搜索并替换为路径中的某个值最后将所有这些文档持久保存在数据库中 example myCollection doc1 summary Summary 1 one
应用程序崩溃：针对 S+（版本 31 及更高版本）要求在创建 PendingIntent 时指定 FLAG_IMMUTABLE 或 FLAG_MUTABLE 之一

将 Targetsdk 版本更新到 31 后应用程序在挂起的意图上给出错误我已更新所有待处理的意图然后运行该应用程序但该应用程序现在因此错误而崩溃引起原因 java lang IllegalArgumentException fm
广播接收器检测应用程序启动

我想捕获用户使用我的广播接收器启动任何应用程序时的时间广播接收器有可能捕获这样的事件吗如果是是否有任何权限可以这样做您能做的最好的事情就是创建一个 STICKY 服务来跟踪所有正在运行的应用程序 Override public in
std::mutex 性能与 win32 CRITICAL_SECTION 相比

的表现如何std mutex相比CRITICAL SECTION 是同等水平吗我需要轻量级同步对象不需要是进程间对象是否有任何接近的STL类CRITICAL SECTION以外std mutex 请参阅我在答案末尾的更新自 Visu

std::mutex 性能与 win32 CRITICAL_SECTION 相比

std::mutex 性能与 win32 CRITICAL_SECTION 相比 的相关文章

随机推荐

热门标签

std::mutex 性能与 win32 CRITICAL_SECTION 相比的相关文章