C++ 模板的性能？ [关闭]

2024-01-05

我在网上看到过几次有人提到 C++ 使用模板可以变得更快。

有人可以解释一下，包括在低层次上解释一下为什么会这样吗？我总是认为这样一个“好的”功能会像大多数有用的概念一样产生开销。

从超低延迟的角度来看，我对此非常感兴趣！

一个常见的例子是排序。

In C, qsort接受一个指向比较函数的指针。一般来说，都会有一份qsort代码，未内联。它将通过指向比较例程的指针进行调用——当然这也不是内联的。

In C++, std::sort是一个模板，它可以将函子对象作为比较器。有一个不同的副本std::sort对于用作比较器的每种不同类型。假设您使用重载的函子类operator()，然后调用比较器can很容易被内联到这个副本中std::sort.

因此，模板为您提供了更多内联，因为有更多的副本sort代码，每个代码都可以内联不同的比较器。内联是一个相当好的优化，并且排序例程会进行大量比较，因此您可以经常测量std::sort比同类跑得更快qsort。这样做的代价是可能会出现更大的代码——如果您的程序使用许多不同的比较器，那么您将获得排序例程的许多不同副本，每个副本都包含不同的比较器。

原则上，C 实现没有理由不能内联qsort进入它被称为的地方。然后，如果使用函数名称调用它，理论上优化器可以观察到在使用它时，函数指针must仍然指向相同的功能。然后它可以内联对该函数的调用，结果将类似于std::sort。但在实践中，编译器往往不会迈出第一步，内联qsort。这是因为（a）它很大，并且（b）它位于不同的翻译单元中，通常编译到您的程序链接的某个库中，并且（c）要这样做，您将有一个内联副本qsort对于每次调用它，而不仅仅是每个不同比较器的副本。因此它会比 C++ 更加臃肿，除非实现也能找到一种方法来在以下情况下通用代码：qsort在不同的地方用相同的比较器调用。

因此，通用函数如qsort由于通过函数指针或其他间接调用[*]，C 中往往会产生一些开销。 C++ 中的模板是保持源代码通用但确保其编译为专用函数（或多个此类函数）的常用方法。专用代码有望更快。

值得注意的是，模板绝不只是与性能有关。std::sort本身比qsort在某些方面。例如qsort只对数组进行排序，而std::sort可以对提供随机访问迭代器的任何内容进行排序。例如，它可以对deque，其内部是几个单独分配的不相交数组。因此，使用模板并不一定会带来任何性能优势，可能是出于其他原因。碰巧模板确实会影响性能。

[*] 另一个排序示例 -qsort接受一个整数参数，表示数组的每个元素有多大，因此当它移动元素时，必须调用memcpy或与此变量的值类似。std::sort在编译时知道元素的确切类型，从而知道确切的大小。它可以内联一个复制构造函数调用，该调用反过来可能会转换为复制该字节数的指令。与内联比较器一样，通常可以比调用复制可变字节数的例程（向其传递值 4（或 8）来更快地复制 4（或 8、或 16 或其他）字节）。，或 16，或其他）。和以前一样，如果你打电话qsort具有大小的字面值，并且调用qsort被内联，那么编译器可以在 C 中执行完全相同的优化。但实际上您看不到这一点。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++ 模板的性能？ [关闭] 的相关文章

向 ExpandoObject 添加方法时，“关键字 'this' 在静态属性、静态方法或静态字段初始值设定项中无效”

我尝试向 ExpandoObject 添加一个动态方法该方法将返回属性动态添加给它但它总是给我错误我在这里做错了什么吗 using System using System Collections Generic using Sys
如何创建可以像 UserControl 一样编辑的 TabPage 子类？

我想创建一个包含一些控件的 TabPage 子类并且我想通过设计器来控制这些控件的布局和属性但是如果我在设计器中打开子类我将无法像在 UserControl 上那样定位它们我不想创建一个带有 UserControl 实例的 Tab
C++：重写已弃用的虚拟方法时出现弃用警告

我有一个纯虚拟类它有一个纯虚拟方法应该是const 但不幸的是不是该接口位于库中并且该类由单独项目中的其他几个类继承我正在尝试使用这个方法const不会破坏兼容性至少在一段时间内但我找不到在非常量方法重载时产生警告的方法以下
构造函数中显式关键字的使用

我试图了解 C 中显式关键字的用法并查看了这个问题C 中的explicit关键字是什么意思 https stackoverflow com questions 121162 但是那里列出的示例实际上是前两个答案对于用法并不是很清楚
ASP MVC：服务应该返回 IQueryable 的吗？

你怎么认为你的 DAO 应该返回一个 IQueryable 以便在你的控制器中使用它吗不您的控制器根本不应该处理任何复杂的逻辑保持苗条身材模型而不是 DAO 应该将控制器返回给视图所需的所有内容我认为在控制器类中看到查询甚至
IronPython：没有名为 json 的模块

我安装了 IronPython 我的 python 文件如下所示 import sys print sys version import json 运行它的代码 var p Python CreateEngine var scope p C
C 语言中 =+（等于加）是什么意思？

我碰到与标准相反今天在一些 C 代码中我不太确定这里发生了什么我在文档中也找不到它 In ancientC 版本相当于它的残余物与最早的恐龙骨头一起被发现例如 B 引入了广义赋值运算符使用x y to add y to x
即使手动设置显示环境变量后，WSL Ubuntu 也会显示“错误：无法打开显示”

我在 WSL Ubuntu 上使用 g 我使用 git 克隆了 GLFW 存储库使用了ccmake命令配置并生成二进制文件然后使用make在 build 目录中最终创建 a文件我安装了所有OpenGL相关的库 usr ld 我不记得我
将数据打印到文件

我已经超载了 lt lt 运算符使其写入文件并写入控制台我已经为同一个函数创建了 8 个线程并且我想输出 hello hi 如果我在无限循环中运行这个线程例程文件中的o p是 hello hi hello hi hello hi e
在非活动联合成员上使用“std::addressof”是否定义明确[重复]

这个问题在这里已经有答案了下面的代码是尝试实现constexpr的版本offsetof在 C 11 中它可以在 gcc 7 2 0 和 clang 5 0 0 中编译这取决于申请std addressof工会非活跃成员的成员这是明确
Azure 事件中心 - 按顺序接收事件

我使用下面的代码从 Azure Event Hub 接收事件 https learn microsoft com en us azure event hubs event hubs dotnet framework getstarted s
无法将类型“System.IO.Stream”隐式转换为“Java.IO.InputStream”

我提到了一些类似的问题但没有一个涉及IO 当我使用时我在java中使用了相同的代码Eclipse 那次就成功了但现在我尝试在中使用这段代码Mono for Android C 它不起作用我正在尝试运行此代码来创建一个InputStr
C# 中条件编译符号的编译时检查（参见示例）？

在 C C 中你可以这样做 define IN USE 1 define NOT IN USE 1 define USING system 1 system 1 IN USE 进而 define MY SYSTEM IN USE if US
通过 NHibernate 进行查询，无需 N+1 - 包含示例

我有一个 N 1 问题我不知道如何解决它可以在这个问题的底部找到完全可重复的样本因此如果您愿意请创建数据库设置 NUnit 测试和所有附带的类并尝试在本地消除 N 1 这是我遇到的真实问题的匿名版本众所周知这段代码对于帮助
获取 2 个数据集 c# 中的差异

我正在编写一个简短的算法它必须比较两个数据集以便可以进一步处理两者之间的差异我尝试通过合并这两个数据集并将结果更改放入新的数据集来实现此目标我的方法如下所示 private DataSet ComputateDiff DataSet
尚未处理时调用 Form 的 Invoke 时出现 ObjectDisposeException

我们得到一个ObjectDisposedException从一个电话到Invoke在尚未处理的表格上这是一些演示该问题的示例代码 public partial class Form2 Form void Form2 Load object
将代码拆分为标头/源文件

我从 Asio 的示例页面中获取了以下代码 class tcp connection public boost enable shared from this
在类的所有方法之前运行一个方法

在 C 3 或 4 中可以做到这一点吗也许有一些反思 class Magic RunBeforeAll public void BaseMethod runs BaseMethod before being executed public
strcmp 给出分段错误[重复]

这个问题在这里已经有答案了这是我的代码给出分段错误 include
剪贴板在 .NET 3.5 和 4 中的行为有所不同，但为什么呢？

我们最近将一个非常大的项目从 NET Framework 3 5 升级到 4 最初一切似乎都工作正常但现在复制粘贴操作开始出现错误我已经成功制作了一个小型的可复制应用程序它显示了 NET 3 5 和 4 中的不同行为我还找到了一种解

随机推荐

CMake 项目找不到共享库

我正在使用 CMake 构建跨平台项目目前我正在尝试在 Linux 上运行它我最近添加了一个用于运行测试的项目但它不会运行因为它找不到共享库之一特别是libtbbmalloc so 2 tests error while load
静态析构函数

假设我有 void foo static Bar bar c 是否保证 Bar Bar 在 bar 上被调用并且 Bar Bar 永远不会在 bar 上调用直到 main 退出之后 Thanks 是的第一次foo 叫做 Bar bar
您如何向非程序员解释演员？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案好吧标题差不多就是这样如果我让一个非技术人员我的妈妈 12 岁的男孩可卡犬坐在你面前并要求你解释actors http en
Pandas - groupby ValueError：无法使用包含多个元素的元组对列进行子集化。使用列表代替

我将我的 Pandas 从我认为是 1 5 1 更新到了 2 0 1 无论如何我开始在一些以前运行良好的代码上出现错误 df df groupby df date dt date Lake Canyon mean reset index
警告 C26454：算术溢出：“-”运算在编译时产生负的无符号结果 (io.5)

代码分析 ON NOTIFY TCN SELCHANGE IDC TAB HISTORY TYPE CAssignHistoryDlg OnTcnSelchangeTabHistoryType 警告 C26454 算术溢出运算产生负的无符
使用 EF Core 在 Azure Functions 上的 Application Insights 中启用 Sql 依赖关系

我有一个 Azure Function v3 应用程序它使用Microsoft EntityFrameworkCore 3 1 5 我无法启用 SQL 依赖项跟踪已经挣扎了1天了为了隔离问题我创建了一个不带 EF 的独立 Azure
如何在Sphinx Alabaster主题下编辑侧边栏

我有以下内容index rst file Know the cell population of your data Some content toctree maxdepth 2 Installation toctree maxdepth
阻止 Chrome 缓存网站的 DNS 记录

Chrome 会缓存 DNS 记录并且在成功连接到我的网站除非重新启动后往往会忽略对主机文件的更改启用 DNS 预取后这种情况更加明显是否有任何页面标头指示 Chrome 不缓存网站的 DNS 喜欢Cache Control或类
您可以安装不需要 Visual Studio 的独立 TFS 客户端吗？

是否可以在未安装 Visual Studio 的服务器上获得独立的 TFS 客户端我们想要一种从服务器访问 TFS 项目的方法而无需安装 Visual Studio 可能的我见过 Team Explorer 但是如果没有 Visua
获取连接网络的 WiFi 信号强度

我正在尝试在 Android 应用程序中显示已连接 WiFi 网络的信号强度我尝试过以下方法 Receiver for information on the network info private BroadcastReceiver m
CakePHP：向表单添加字段（动态）

我正在尝试动态地将字段添加到我的 CakePHP 表单中但似乎我使用的每种方法都有其自己无法修复的缺点这是我尝试过的不要添加新的输入只需用逗号分隔单个输入中的值即可这看起来很简单但在尝试分解输入并将每个值保存在数据库中的新行中时
为 C# 生成 XML 文档的 XSD？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有谁知道某处是否有 XSD 文件可用于验证使用 doc 选项编译 C 项目时生成的 XML 文档我想
如何为依赖动态数据的函数编写单元测试？

假设您有一个网站它使用一个函数从数据库检索数据并返回要显示解析等的结果由于从数据库检索的数据是动态的并且可能每天都在变化因此如何正确地为此函数编写单元测试假设该函数应该返回一个结果数组显然单元测试可以测试是否返回数组但是
如何设置 Windows 符号服务器

我在网络上有一个备用服务器我想用它来托管我们所有的构建符号我已经知道如何在本地开发系统上设置符号缓存并将调试器例如 Windbg 指向符号文件路径中的该路径我认为我可以对网络上具有自己的符号缓存例如 host symbols
错误：Firestore 已初始化。您只能调用 settings() 一次，并且只能在调用 Firestore 对象上的任何其他方法之前

因此我正在为 firebase 规则编写测试以便我可以为我在 stackoverflow 上编写的另一个问题创建可重现的代码但我收到此错误 mocha test2 js Our social app 1 Can read a sing
VBA从Word表格复制到Excel

我正在尝试从 Word 文件中的特定表单元格生成一个包含 5 列的 Excel 文件从 Word 表复制到 Excel 我的Word文件有280个表格我对要从 Word 文件复制的单元格进行寻址没有问题但我不知道为什么结果是一个空白的
通过 iPhone Web 应用程序访问相机

据我了解不太可能通过 HTML 访问网络摄像头那么在 iPhone 上呢是否可以从 iOS6 开始您可以使用以下命令访问相机和照片
如何为Python 3子进程分配CPU亲和力？

我在 Python 方面还是个新手我在 Windows 7 和 Windows 10 上运行 Tkinter GUI 我有一个子进程以 1 KHz 运行数据记录器例程我想为子进程设置 cpu 亲和力我正在使用 Python 3 8 进
使用 Media * API 进行录制时，支持的媒体类型的完整列表在哪里？

我正在尝试学习如何在浏览器中记录媒体我可能会让事情变得过于复杂有大量直接的例子但当录音被推到一个高度时我陷入了困境 Blob具有任意选择的媒体类型的对象而不检查该格式是否受支持因此我认为有一个清单或者人们只是继续以过去的经验
C++ 模板的性能？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi

C++ 模板的性能？ [关闭]

C++ 模板的性能？ [关闭] 的相关文章

随机推荐

热门标签