为什么线程本地存储不使用页表映射来实现？

2024-06-05

我希望使用 C++11thread_local将非常频繁地访问的每线程布尔标志的关键字。

然而，大多数编译器似乎都使用一个表来实现线程本地存储，该表将整数 ID（槽）映射到当前线程上的变量地址。此查找将发生在性能关键的代码路径内，因此我对其性能有一些担忧。

我期望实现线程本地存储的方式是根据线程分配由不同物理页支持的虚拟内存范围。这样，访问该标志的成本与任何其他内存访问的成本相同，因为 MMU 负责映射。

为什么主流编译器都不以这种方式利用页表映射？

我想我可以实现我自己的“特定于线程的页面”mmap在 Linux 和VirtualAlloc在 Win32 上，但这似乎是一个非常常见的用例。如果有人知道现有或更好的解决方案，请向我指出。

我也考虑过存储std::atomic<std::thread::id>在每个对象内代表活动线程，但分析显示检查std::this_thread::get_id() == active_thread相当昂贵。

在 Linux/x86-64 上，线程本地存储是通过特殊的段寄存器实现的%fs (per x86-64 ABI https://software.intel.com/sites/default/files/article/402129/mpx-linux64-abi.pdf第 23 页...）

所以下面的代码（我使用C + GCC扩展__thread语法，但与C++11相同thread_local)

__thread int x;
int f(void) { return x; }

被编译（与gcc -O -fverbose-asm -S) into:

         .text
 .Ltext0:
         .globl  f
         .type   f, @function
 f:
 .LFB0:
         .file 1 "tl.c"
         .loc 1 3 0
         .cfi_startproc
         .loc 1 3 0
         movl    %fs:x@tpoff, %eax       # x,
         ret
         .cfi_endproc
 .LFE0:
         .size   f, .-f
         .globl  x
         .section        .tbss,"awT",@nobits
         .align 4
         .type   x, @object
         .size   x, 4
 x:
         .zero   4

因此，与您担心的相反，在 Linux/x86-64 上访问 TLS 非常快。它并不完全作为一个表来实现（而是由内核和运行时管理%fs段寄存器指向线程特定的内存区域，编译器和链接器管理那里的偏移量）。然而，老pthread_getspecic http://pubs.opengroup.org/onlinepubs/009695399/functions/pthread_setspecific.html确实通过了一个表，但是一旦你有了 TLS，几乎就没用了。

BTW, 根据定义, all threads http://en.wikipedia.org/wiki/Thread_%28computing%29在相同的process http://en.wikipedia.org/wiki/Process_%28computing%29分享相同的地址空间 http://en.wikipedia.org/wiki/Address_space in 虚拟内存 http://en.wikipedia.org/wiki/Virtual_memory，因为一个进程有自己的单一地址空间 http://en.wikipedia.org/wiki/Virtual_memory. (see /proc/self/maps等等...看看proc(5) http://man7.org/linux/man-pages/man5/proc.5.html了解更多关于/proc/，并且mmap(2) http://man7.org/linux/man-pages/man2/mmap.2.html; C++11线程库基于pthreads https://computing.llnl.gov/tutorials/pthreads这是使用实现的clone(2) http://man7.org/linux/man-pages/man2/clone.2.html）。所以“线程特定的内存映射”是一个矛盾：一旦一个任务（由内核调度程序运行的东西）拥有自己的地址空间，它就被称为进程（而不是线程）。的定义特征threads https://computing.llnl.gov/tutorials/pthreads/#Thread在同一进程中是共享一个公共地址空间（以及一些其他实体，例如文件描述符）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么线程本地存储不使用页表映射来实现？的相关文章

从 WatchOS 捕获 Apple Watch 的型号标识符

似乎没有任何记录的官方方法可以从手表应用程序获取 Apple Watch 模型但有一篇文章显示了特殊用途sysctlbyname 如何确定Apple Watch型号 https stackoverflow com questions 49
pop() 期间提升 Fibonacci 堆访问冲突

Context 我目前正在实现某种形式的 A 算法我决定使用 boost 的斐波那契堆作为底层优先级队列我的图表是在算法运行时构建的作为我使用的顶点对象 class Vertex public Vertex double double
替换大字符串中的多个字符串的最快方法

我正在寻找替换大 1mb 字符串的多个 500 子字符串的最快方法无论我尝试过什么 String Replace 似乎都是最快的方法我只关心最快的方式不是代码的可读性可维护性等我不在乎是否需要使用不安全的代码或预处理原始字符串每
错误：调用 Configuration.BuildSessionFactory() 时“无法同时获取多个包”；

升级到 NHibernate 2 1 后我们收到此错误 QueryException Cannot simultaneously fetch multiple bags NHibernate Loader BasicLoader Post
不同平面中不同幅值的两条线段之间最近的两个 3D 点

比方说AB1 AB2 CD1 CD2 AB1 AB2 and CD1 CD23D 点构成线段所说的线段是不在同一平面 AP是一个点线段AB1 AB2 BP是一个点线段CD1 CD2 Point1 and Point2彼此最接近两条线
在 UserControl C# .NET 中添加/停靠控件

我正在编写一个 UserControl 它以编程方式添加子控件目前我正在添加新的控件如下所示 this Controls Add new Control Height 16 Dock DockStyle Top 我遇到的问题是新控件添加
CMake include_directories 和 add_subdirectories 之间的区别？

我正在学习 CMake 来构建 C 代码并努力解决以下概念在我的根级目录中我有一些 cpp 文件和 CMakeLists txt 它们在 gen cpp 目录中成功生成了一些 thrift 代码我的根级别 CMakeLists tx
使用自定义对象的动态列表并且无法动态更改dataGrid的单元格属性

我刚开始在 Stack 上发帖我已经搜索了很长一段时间来解决与我类似的问题我试图根据对象的布尔值动态地将 WinForms DataGridView 中的复选框从非只读更改为只读它在调试模式下显示更改已经发生但是一旦完全运行应该只
NHibernate 继承 - 判别器值

NHibernate 是否可以有一个像这样工作的判别器如果值等于 String Empty gt Class1 其他 gt Class2 我已经有一个 CultureName 字符串列我想将其用作鉴别器我不想添加额外的布尔列如果 C
“#include ”导致“错误：asm/io.h：没有这样的文件或目录”

我正在使用 gentoo 并尝试编译一个程序来控制并行端口上的位它的顶部附近有这一行 include
开始学习 C# 的最佳方式是什么？

我对 vb 6 有一点编程经验而 vb net 则不多请告诉我成为专家 C 程序员的最佳方法我知道这需要很长时间想想你如何学习人类语言阅读写作口语和听力阅读代码阅读文章阅读示例当您更有经验时请查看您使用的一些项目的源
在 Silverlight 中调用 WCF 服务时使用 Observable.FromEvent

我正在尝试使用 NET Reactive Framework 来简化对我正在编写的 Silverlight 3 应用程序使用的 WCF 服务的一些异步调用问题是我很难找到一种有效的方式来构建我的代码毫无疑问部分问题是了解 Reacti
像 MS Excel 一样在 C++ 中舍入双精度值

我在网上进行了搜索但找不到解决我的问题的方法我只是想要一个像 MS Excel 那样对双精度值进行舍入的函数这是我的代码 include
如何使用 SonarQube 的 C# 插件设置 FxCop 安装路径

我正在尝试使用 SonarQube C 插件分析 NET C 项目从C Plugin 3 0开始即使sonar project properties中的 sonar fxcop mode skip FxCop也会自动执行所以我将FxC
如何隐藏鼠标光标？

我想问是否有人可以为我提供一个 C 代码在其中我可以在按下特定键时隐藏显示鼠标指针我发现一些只为 TURBO C 编写的代码它们都不能使用 dev c 甚至 Visual c 编译和运行我尝试运行在 Dev C 中找到的代码但我
.NET Compact Framework 上的 DateTime.Now 中的毫秒始终为零？

我想要一个时间戳对于日志Windows 移动项目精度必须至少在一百毫秒范围内然而我打电话给DateTime Now返回一个DateTime对象与Millisecond属性设置为零还有Ticks属性相应地进行四舍五入如何获得更好的时间
着色器可以旋转形状以面向相机吗？

我制作了一个球出现在 3D 空间中的场景三角球耗费大量资源所以我使用带有球纹理的二维表面四边形来完成此操作但现在我需要在每次相机移动时调整形状的方向我使用位置变换和 LookAt 方法来完成此操作问题是我可以优化这个吗如果可
在 Outlook 中检索当前电子邮件正文

在我的 Outlook 插件中我想在功能区上添加一个按钮因此当用户单击此按钮时我想检索当前选定的电子邮件的正文我有此代码但它只检索收件箱中的第一封电子邮件因为索引为 1 Microsoft Office Interop Outl
用于 DSP 的快速 2D 卷积

我想实现一些图像处理算法这些算法旨在运行在小猎犬板 http en wikipedia org wiki Beagle Board 这些算法广泛使用卷积我正在尝试为 2D 卷积找到一个好的 C 实现可能使用快速傅里叶变换我还希望该算
C++ 中的 golang 风格“延迟”[重复]

这个问题在这里已经有答案了我正在阅读有关 go 语言的defer http blog golang org defer panic and recover陈述它允许您指定函数结束时要执行的操作例如如果您有一个文件指针或资源则只需指

随机推荐

如何在 WPF 数据网格中添加页脚行？

如何在 WPF 数据网格中添加页脚行我必须在 WPF 数据网格中为每列的总和添加一行我不想使用任何 dll 或 telerik 以及类似的东西仅使用 Microsoft 组件来执行此操作我正在尝试这样做
难以理解 R 中双括号和单括号子集之间的区别[重复]

这个问题在这里已经有答案了我很难理解双括号子集和单括号子集之间的区别我在开源编程方面相当陌生我很难理解 R 中的 help 函数因为考虑到我目前对 R 的理解其中的一些信息对我来说太技术性了我尝试过谷歌搜索差异虽然它给了我一个
在 ASP .NET Core 2.1 Web Api 中启用 CORS

我正在使用 ASP NET Core 2 1 Web API 和 React 编写应用程序我的服务器位于 localhost 5000 上客户端位于 localhost 3000 上我想用 axios 发送 post 请求但在浏览器
如何在JavaFX中为TextArea设置圆角？

我需要在 TextArea 上有圆角但它看起来有点奇怪看起来有些内层也应该有相同半径的圆角但是哪一个呢我使用这个CSS text area fx background color dbb1b1 fff0f0 fx backgrou
从另一个分支或从 master 创建 Git 分支？

所以我是 Git 新手我最近从存储库中提取了主分支的新版本我创建了一个branch 1 获取某个功能并将其推送到存储库并创建拉取请求现在我创建了一个新的branch 2 具有另一个功能但由于我的拉取请求尚未合并再次拉取 maste
根据多行中的总分对 mysql 中的用户进行排名

我有与这个问题中描述的非常相似的要求 mysql中的用户按积分排名 https stackoverflow com questions 34637943 rank users in mysql by their points 唯一的区别在于
MySQL 可以存储多少行？

所以我是一个初学者刚刚自学了几个月的MySQL 我在工作中总是使用 phpMyAdmin 我过去的工作只涉及大约 100k 行的表所以没有什么大问题然而我的客户现在想要在表中存储大约 800 万行 MySQL phpMyAdmin
如何在C中将一个字符串拆分为2个字符串

我想知道如何获取 1 个字符串用分隔符例如空格将其拆分为 2 个字符串并将这 2 个部分分配给 2 个单独的字符串我尝试过使用strtok 但无济于事 include
GO中的优先级队列

谁能向我解释一下我想在GO中实现一个优先级队列接口实现来自link https golang org pkg container heap example priorityQueue 但优先级最低我的代码 pq make Priori
为 JSP 创建注销链接？

当用户登录我的应用程序时他提交一个要通过 Servlet 处理的表单 servlet 为用户创建一个会话我如何创建一个链接以便用户可以注销我似乎无法直接链接到 Servlet 如何删除会话并链接回主页 HttpSession sess
读取 Android 4.2 中的 APN？

我有个问题阅读 APN在安卓v4 2中是读不是写APNS 它抛出一个安全异常没有写入 APN 设置的权限用户 10068 和当前用户都没有权限进程有 android permission WRITE APN SETTINGS 相同
如何通过仅调用一个命令来构建多个目标？

我得到了一个像下面这样的 Makefile PHONY all all aaa 2 bbb 2 aaa 2 aaa 1 common 1 create 2 bbb 2 bbb 1 common 1 create 2 程序 create 2
在Android中打开浮动菜单（上下文菜单）？

我创建了一个新菜单名为 drmenu xml 当我按下菜单按钮时它可以正常工作但是当用户按下按钮时我需要打开上下文菜单下面的代码按钮只显示一个吐司这是我的 xml 布局
使用 AJAX 来回发送信息

使用 post 你可以向服务器发送信息但是当你需要从服务器接收信息时怎么办呢信息如何从可以由 php 变量保存的方式变为可以由 javascript 变量保存的方式反之亦然这与您的问题更相关 http docs jquery com
如何对转换库进行单元测试？

我刚刚开始使用 C 进行单元测试我已经阅读有关单元测试的内容很长时间了并且已经开始使用 NUnit 但这是我第一次真正尝试为真实代码编写真正的测试但我的问题是我很难想出可以实际测试的东西我要测试的项目是一个转换库将 POCO 列
Javadoc 链接到其他类中的方法

目前我正在使用以下 Javadoc 语法引用其他类中的方法 see link com my package Class method 据我从文档中了解到这是执行此操作的正确方法但现在到了有趣的部分或者说令人沮丧的部分当我生成这个 j
python - 如何删除每行中的重复列表（pandas）？

我的每一行中都包含一个列表我想通过保留分数中的最高值来删除重复元素这是我的数据框 df1 中的数据 pair score 0 A A 1 0000 1 A F 0 9990 2 A G 0 9985 3 A G 0 9975 4 A H
协变和逆变 - 只是调用有保证的基类行为的不同机制？

我很难理解这两个概念但我认为在看了很多视频和 SO QA 之后我将其简化为最简单的形式协变假设子类型可以执行其基本类型的操作逆变假设您可以像对待其基本类型一样对待子类型假设这三个类 class Animal void Live
打开和关闭 WPF DataGrid 背景图像？

我有一个 DataGrid 当它为空时我希望显示背景图像当填充 DataGrid 时我希望图像消失并在再次清除 DataGrid 时重新出现这可以通过 XAML 或 C 实现吗 if myDataGridView Rows Cou
为什么线程本地存储不使用页表映射来实现？

我希望使用 C 11thread local将非常频繁地访问的每线程布尔标志的关键字然而大多数编译器似乎都使用一个表来实现线程本地存储该表将整数 ID 槽映射到当前线程上的变量地址此查找将发生在性能关键的代码路径内因此我对其性能

为什么线程本地存储不使用页表映射来实现？

为什么线程本地存储不使用页表映射来实现？ 的相关文章

随机推荐

热门标签

为什么线程本地存储不使用页表映射来实现？的相关文章