性能差异：std::accumulate vs std::inner_product vs Loop

2023-11-24

今天，我想分享一些在我尝试实现这个简单操作时令我震惊的事情：

我发现执行相同操作的不同方法：

通过使用std::inner_product.
实现谓词并使用std::accumulate功能。
使用 C 风格的循环。

我想通过使用 Quick Bench 并启用所有优化来执行一些基准测试。

首先，我比较了两种具有浮点值的 C++ 替代方案。这是使用使用的代码std::accumulate:

const auto predicate = [](const double previous, const double current) {
    return previous + current * current;
};
const auto result = std::accumulate(input.cbegin(), input.cend(), 0, predicate);

与此代码相比，使用std::inner_product功能：

const auto result = std::inner_product(input.cbegin(), input.cend(), input.cbegin(), 1);

在启用所有优化的情况下运行基准测试后，我得到了以下结果：

两种算法似乎达到了相同的性能。我确实想进一步尝试 C 实现：

double result = 0;
for (auto i = 0; i < input.size(); ++i) {
  result += input[i] * input[i];
}

令人惊讶的是，我发现：

我没想到这个结果。我确信有问题，所以我检查了 GCC 的实现：

template<typename _InputIterator1, typename _InputIterator2, typename _Tp>
inline _Tp
inner_product(_InputIterator1 __first1, _InputIterator1 __last1,
      _InputIterator2 __first2, _Tp __init)
{
  // concept requirements
  __glibcxx_function_requires(_InputIteratorConcept<_InputIterator1>)
  __glibcxx_function_requires(_InputIteratorConcept<_InputIterator2>)
  __glibcxx_requires_valid_range(__first1, __last1);

  for (; __first1 != __last1; ++__first1, (void)++__first2)
__init = __init + (*__first1 * *__first2);
  return __init;
}

我发现它的做法与 C 实现相同。在审查了实现之后，我发现了一些奇怪的事情（或者至少我没想到会产生那么重大的影响）：在所有内部累积中，它正在从迭代器 value_type 到初始值的类型进行转换。

就我而言，我将初始值初始化为 0 或 1，这些值被视为整数，并且在每次累加中，编译器都会进行转换。在不同的测试用例中，我的输入数组存储截断的浮点数，因此结果没有改变。

将初始值更新为 double 类型后：

const auto result = std::accumulate(input.cbegin(), input.cend(), 0.0, predicate);

And:

const auto result = std::inner_product(input.cbegin(), input.cend(), input.cbegin(), 0.0);

我得到了预期的结果：

现在，我明白，将初始值保留为独立于迭代器基础类型的类型可能会使函数更加灵活并允许执行更多操作。但，

如果我正在累积数组的元素，我希望得到相同类型的结果。内积也是如此。

它应该是默认行为吗？

为什么标准决定以这种方式执行？

如果我正在累积数组的元素，我希望得到相同类型的结果。

您的期望是错误的（尽管不太清楚“与结果相同的类型”是什么意思），正如您可以清楚地看到的std::累积文档：

template< class InputIt, class T >
T accumulate( InputIt first, InputIt last, T init );

template< class InputIt, class T, class BinaryOperation >
T accumulate( InputIt first, InputIt last, T init,
              BinaryOperation op );

返回类型与您用于初始值的类型完全相同。您可以在循环中获得相同的效果：

auto result = 0; // vs auto result = 0.0;
for (auto i = 0; i < input.size(); ++i) {
  result += input[i] * input[i];
}

为什么标准决定以这种方式执行？

因为这样你就可以决定使用什么类型来聚合。笔记std::accumulate可用于左折叠和箱子T不等于std::iterator_traits<InputIt>::value_type并不比它们匹配时更少（甚至可能更多）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

STL

c14

profiling

languagelawyer

性能差异：std::accumulate vs std::inner_product vs Loop 的相关文章

HttpResponseMessage 的内容为 JSON

我有一个 ASP NET MVC WEB API 由于多种原因由于没有授权而重定向我不能只使用一个简单的对象并在我的控制器方法中返回它因此我需要 HttpResponseMessage 类来允许我重定向目前我正在这样做 var re
静态成员函数与C语言绑定？

以下 C 代码可使用 Visual C 和 g 进行编译 struct S static void foo extern C void S foo struct T static void foo extern C void T foo a
当“”可以分配给std::string时，为什么有“clear”方法？

一个可以用string clear函数清空字符串也可以使用空双引号来执行此操作有什么不同当您分配一个空字符串时编译器必须在数据部分存储一个空的 C 字符串并创建代码以将指向它的指针传递给赋值运算符然后赋值运算符必须从数据部分
C++17 中带有 noexcept 的 std::function

在 C 17 中noexcept 已添加到类型系统中 http www open std org jtc1 sc22 wg21 docs papers 2015 p0012r1 html void r1 void f noexcept f
将 LINQ to Entities 查询中的每个项目转换为接口的最佳方法是什么？

我有一个实现 IUser 的实体对象 User IQueryable
错误 C2064：术语不计算为采用 1 个参数的函数

class Student bool Graduate return m bGraduate class School vector
ObservableCollection 上的“Cascade”绑定，包含其他 ObservableCollection

我有一个项目需要显示合同列表 Class Affaire 每个合约都有一个阶段列表类别阶段我使用绑定在 2 个不同的 ListView 中显示它们中的每一个问题是当我从 ListView 中删除一个 Phase 时显示 Phases
优化对绑定到 DataGridView 的 DataTable 的更新

我的应用程序中有一个显示一些数据的表单当我第一次显示表单时我将一些数据加载到 DataTable 中然后将 DataTable 绑定到 DataGridView 我还启动了一个异步方法来执行一些较慢的数据库查询当这些慢查询完成时我
CMake - 未定义参考

我正在尝试将 gtest 包含到我的项目中问题是我在 GTest 中收到未定义的引用错误我正在尝试在 Gtest 中测试 Node 类在节点的构造函数中我使用类记录器尽管我已将库记录器添加到 gtest target 中但我仍然
设置外部应用程序焦点

在 VB NET 中您可以使用以下命令将焦点设置到外部应用程序 AppActivate Windows Name or AppActivate processID As Integer 现在如果您这样做则效果很好 Dim intNot
.NET 中 IEqualityComparer 中 GetHashCode 的作用是什么？

我试图了解 IEqualityComparer 接口的 GetHashCode 方法的作用下面的例子取自MSDN using System using System Collections Generic class Example st
了解 MVC-5 身份

我创建了一个新的ASP NET MVC 5申请与Individual User Accounts然后更新了所有的Nuget packages在解决方案中现在我尝试遵循一些教程中显示的一些指南但遇到了一些问题第一个是一个名为Applic
最小对的总和

Given 2N点 in a 2D plane 你必须将它们分组为N pairs使得所有对的点之间的距离的总和是最小可能值所需的输出只是总和换句话说如果a1 a2 an分别是第一对第二对和第 n 对点之间的距离则 a1 a2 a
一些涉及类析构函数和删除运算符的内存管理问题？

在阅读了一些教程后我仍然不清楚 C 中内存管理的一些观点 1 当使用 new 运算符声明的类超出范围时是否会调用其析构函数并释放内存是否有必要调用删除运算符来释放类的内存并调用其析构函数 class Test void newTest
C++ std:.auto_ptr 或 std::unique_ptr （支持多个编译器，甚至是旧的 C++03 编译器）？

我正在尝试更新一些 C 代码我想转向更现代的代码 c 11 但我仍然需要使用一些较旧的编译器兼容 c 03 来编译代码因为支持的平台限制我知道在 C 11 编译器中 std auto ptr 已被弃用但由于较旧的编译器支持我不能
在发送传出请求之前将新的 SoapClient 绑定到特定 IP 地址

假设应用程序所在的计算机具有 SoapClient 具体来说我正在使用 Microsoft Web Service3 Messaging SoapClient 它通过发送传出请求并获取 SoapEnvelope 作为回报完善的流程与远
派生类的聚合初始化

以下代码无法使用 Visual Studio2017 或在线 GDB 进行编译我期望它能够编译因为迭代器只是一个具有类型的类并且它是从公共继承的这是不允许的还是在 VS2017 中不起作用 template
通过 OCI 调用 Oracle 存储过程并使用 C++ 中的 out ref 游标返回结果

我想使用 OCI 接口从 C 调用 Oracle 存储过程并使用 out SYS REF CURSOR 作为过程的参数来迭代结果我是 OCI 新手所以可能会遗漏一些简单的东西大部分代码取自这里我的存储过程是 CREATE OR R
Selenium WebDriver 在按钮单击事件上无法正常工作。这里有什么问题呢？

I am using following code to scrape data from a website I have following interface 这是 HTML div class es content div
“保留供任何使用”是什么意思？

注意这是一个c questions tagged c问题虽然我补充说c questions tagged c 2b 2b如果某些 C 专家可以提供 C 使用与 C 不同的措辞的基本原理或历史原因在 C 标准库规范中我们有这个规范文本

随机推荐

有没有更 Pythonic 的方法来防止向列表中添加重复项？

是否有更Pythonic 或简洁的方法来防止向列表添加重复项 if item not in item list item list append item 或者这实际上是一种廉价的操作由于 hcwsha的原始解决方案已被替换我将其记录
C# unity 通过属性拦截

有没有办法在 C unity 中使用属性拦截并将对象注册代码保留在 XML 文件如 app config 中如果是的话您能给我提供代码吗这样的注册应该是什么样子我做了很多解决方法但没有找到解决此问题的有效解决方案我假设您的意思
Firefox 内容脚本未在某些页面加载

Context 我目前正在开发一个浏览器扩展它可以在 Chrome 和 Opera 上按预期工作但在 Firefox 上遇到问题这是一个最小版本manifest json重现问题所需 name Example version 0 0
如何在 3D 空间中正确移动相机？

我想做的事我正在尝试弄清楚如何使相机像这样工作鼠标移动相机旋转上下键摄像机前进后退向前表示相机面向的方向左右键相机横向移动 Q E键相机上下移动由于我有很多代码因此我将尽力解释我是如何做到的而不需要太多代码我
如何使用 python 重试 Behave 中的失败场景

有人可以告诉我如何使用 Python 在 Behave 中再次运行失败的测试吗如果失败我想自动重新运行失败的测试用例行为库实际上有一个RerunFormatter这可以帮助您重新运行之前测试运行的失败场景它会创建一个包含所有失败场景
Android NavigationView 带圆角

我正在设计一个定制抽屉 on Android 它的顶部和底部必须有圆角我首先自定义顶部我发现问题是形状的背景不透明 I have source toile libre org I need to build source toile l
为什么“插入”函数不使用 MySQLdb 添加行？

我正在尝试弄清楚如何在 Python 中使用 MySQLdb 库对于这两个库我充其量都是新手我正在关注代码here 具体来说 cursor conn cursor cursor execute DROP TABLE IF EXISTS
如何将因子转换为整数\数字而不丢失信息？

当我将因子转换为数字或整数时我得到的是基础级别代码而不是数字形式的值 f lt factor sample runif 5 20 replace TRUE 1 0 0248644019011408 0 0248644019011408
Java方法对任意数量的整数求和

我需要写一个java方法sumAll 它接受任意数量的整数并返回它们的总和 sumAll 1 2 3 returns 6 sumAll returns 0 sumAll 20 returns 20 我不知道该怎么做如果您使用 Java8
使用 array_multisort() 和动态数量的参数/参数/规则/数据对数组进行排序

我正在尝试对任何数组进行排序array multisort 一切都很好但是根据脚本中的条件我需要更改选项到目前为止我所拥有的是这样的 array multisort sort1 SORT ASC sort2 SORT ASC sor
如何在Python中的绘图中添加填充？

我正在尝试在绘图的左侧和右侧添加填充但是当我改变 xlim 和 ylim 时图像变小我究竟做错了什么 import matplotlib pyplot as plt plt rcParams text usetex False fro
在JSF2中，如何知道复合组件是否有子组件？

我正在编写一个复合组件您有一个名为的特殊标签
获取 Android 蓝牙设备的重命名名称

我的 Android 手机允许我重命名已配对的设备方法是转至设置 gt 无线和网络 gt 蓝牙活动页面然后单击已配对蓝牙设备右侧的设置按钮但是当我查询带有以下内容的绑定设备列表时蓝牙适配器 getBondedDevices 函数
如何区分日志文件中的 log4j 会话和同一 Web 应用程序的副本？

只有一个文件它是在 Web 应用程序副本运行时同时写入的如何从其他日志行中仅过滤一条会话日志消息使用具有 NDC 或 MDC 信息的 servlet 过滤器是我见过的最好方法两者的快速比较可以在http wiki apache or
IL 中的 ldsfld 和 ldstr 有什么区别？

我读过一些关于 String Empty 与的文章我也自己做了测试它们之间的区别如下字符串空 L 0001 ldsfld string mscorlib System String Empty L 0001 ldstr 在我与朋友
如何删除python3中的b符号

如何去除bpython3脚本中的符号 import subprocess get data subprocess check output df k awk print 6 shell True data arr get data spli
如何在 JasperReports 中使用条件 TextField？

我想要一对取决于值的文本字段并且 y 值应根据空白空间进行调整当值为 0 我想隐藏文本字段 IE 我想隐藏staticText和textField如果参数red等于 0 并将蓝色值向上移动在下面的 jrxml 代码中
RVM 的 Rails 脚本分段错误

我遇到分段错误应该which ruby返回 usr local bin maletor rails generate mailer ContactMailer Users maletor rvm gems ruby 1 9 2 p0 ge
Elixir - https URL 的问题

我是 Elixir 和 Erlang 的新手在访问 https URL 时遇到一些问题我已经尝试过 Elixir 特定的HTTP选项和 Erlang 的 inets module 因此从 iex 控制台 Interactive Eli
性能差异：std::accumulate vs std::inner_product vs Loop

今天我想分享一些在我尝试实现这个简单操作时令我震惊的事情我发现执行相同操作的不同方法通过使用std inner product 实现谓词并使用std accumulate功能使用 C 风格的循环我想通过使用 Quick Bench

性能差异：std::accumulate vs std::inner_product vs Loop

性能差异：std::accumulate vs std::inner_product vs Loop 的相关文章

随机推荐

热门标签