C++“无原始循环”而不损失性能

2024-03-13

所以“新（旧）大事”是 C++ 中的“无原始循环”。我正在尝试以这种方式编写代码，但似乎效率很低。是的，有些 STL 算法可以做任何事情，但它们似乎效率不高。

例如，我有一种情况，我想要一个指向节点数组中得分最高的节点的指针。确定该分数是一项代价高昂的浮点运算。所以我实现了STL算法版本并将其与原始循环进行了比较：

#include <cfloat>
#include <iostream>
#include <array>
#include <algorithm>
#include <numeric>

static int counter;

class Node {
public:
    auto Score() const -> double {
        std::cout << "complex calculation\n";
        counter++;
        return 1;
    }
};

int main()
{
    
    std::array<Node, 10> nodes;
    
    counter = 0;
    Node const* nodePtr = std::max_element(std::cbegin(nodes), std::cend(nodes),
        [](Node const& node1, Node const& node2) {
            return node1.Score() < node2.Score();
        });
    std::cout << "algorithm count " << counter << std::endl;
    
    counter = 0;
    double maxScore = -FLT_MAX;
    for (const auto& node : nodes) {
        auto score = node.Score();
        if (score > maxScore) {
            maxScore = score;
            nodePtr = &node;
        }
    }
    std::cout << "raw loop count " << counter << std::endl;
}

对此进行评估，对于 STL 版本，昂贵的 Score 函数被评估了 18 次，而原始循环仅使用了 10 次评估......

我做错了吗，还是原始循环并没有那么糟糕？

编辑：经过建议后user58697cout 和静态计数器会阻止编译器优化，我更改了代码：

#include <cfloat>
#include <cmath>
#include <iostream>
#include <array>
#include <algorithm>
#include <numeric>
#include <random>
#include <chrono>

template <typename T>
class Random {
private:
    std::default_random_engine generator;
    std::uniform_real_distribution<T> distribution;
public:
    Random()
        : generator()
        , distribution(0.0, 1.0)
    {}

    auto operator()() {
        return distribution(generator);
    };
};

static Random<double> myRandom;

class Timer {
private:
    std::chrono::high_resolution_clock::time_point startTime{};
public:
    void Start() noexcept {
        startTime = std::chrono::high_resolution_clock::now();
    }
    [[nodiscard]] auto ElapsedMs() const noexcept {
        return std::chrono::duration_cast<std::chrono::milliseconds>(std::chrono::high_resolution_clock::now() - startTime).count();
    }
};

static Timer timer;

class Node {
private:
    double val;
public:
    Node() noexcept : val(myRandom()) {}

    [[nodiscard]] auto Score() const noexcept {
        auto score = std::sqrt(std::log(10.0 / val));
        score = std::sin(score) / std::cos(score);
        score = std::sqrt(std::sqrt(std::sqrt(std::sqrt(std::sqrt(score)))));
        score = std::pow(score, 1000);
        return score;
    }
};

int main()
{
    std::array<Node, 100000> nodes; // yeah, yeah... overloading the stack, I know

    for (auto i = 0; i < 2; i++) {
        timer.Start();
        Node const* nodePtr = &*std::max_element(std::cbegin(nodes), std::cend(nodes),
            [](Node const& node1, Node const& node2) {
                return node1.Score() < node2.Score();
            });
        std::cout << "algorithm elapsed time " << timer.ElapsedMs() << std::endl;

        timer.Start();
        double maxScore = -FLT_MAX;
        for (const auto& node : nodes) {
            auto score = node.Score();
            if (score > maxScore) {
                maxScore = score;
                nodePtr = &node;
            }
        }
        std::cout << "raw loop count " << timer.ElapsedMs() << std::endl;
    }
}

我运行循环两次以消除启动行为...第二次循环的结果（用 g++ 9.1 -O3 编译）：

algorithm elapsed time 16
raw loop count 8 (<== I see I forgot to change "count" to "time" :P)

所以不是这样的。

编辑：看到这个问题得到了点赞，人们还在关注。自从提出这个问题后，C++20就发布了。 C++20 的范围库有一个特殊功能，可以在这里提供帮助，称为投影 http://www.modernescpp.com/index.php/projections-with-ranges.

IE。在这种情况下你可以使用std::ranges::max_element https://en.cppreference.com/w/cpp/algorithm/ranges/max_element甚至std::ranges::max https://en.cppreference.com/w/cpp/algorithm/ranges/max（旧的标准算法中缺少这一点）就像

Node const* node = &*std::ranges::max_element(nodes, {}, &Node::Score);
...
Node const& node = std::ranges::max(nodes, {}, &Node::Score);

然而，由于实现选择不使用缓存，投影并不是这里的解决方案。这Proj投影函数被一次又一次地调用every的论点Comp比较器功能。

（内部函数调用看起来像

return std::invoke(__comp, std::invoke(__proj, __a), std::invoke(__proj, __b)) ? __b : __a;

)

用抽象算法替换原始循环是一种很好的风格，因为这样您就可以多次重复使用该算法，但只测试一次。以这种方式包装循环可能看起来像语法糖，但它大大减少了代码中出现错误的可能性，因为您现在可以对抽象算法进行广泛的单元测试，并且您永远不需要担心在需要时错误地实现它。

然而，您在这里比较的是苹果和橙子。你的max_element实现总是计算Score()进行比较，而你的for循环缓存结果Score()功能。

更好地实施Node可能：

class Node {
mutable:
    double cached_score = std::numeric_limits<double>::quiet_Nan();
public:
    auto Score() const -> double {
        if(std::isnan(cached_score)){
           std::cout << "complex calculation\n";
           counter++;
           cached_score = 1;
        }
        return cached_score;
    }
    void invalidate_cache() {
      cached_score = std::numeric_limits<double>::quiet_Nan();
    }
};

这样复杂的计算只执行一次。

或者，编写您自己的抽象：

#include <cfloat>
#include <iostream>
#include <array>
#include <algorithm>
#include <numeric>

static int counter;

class Node {
public:
    auto Score() const -> double {
        std::cout << "complex calculation\n";
        counter++;
        return 1;
    }
};

template<class ForwardIt, class Evaluate, class Compare>
ForwardIt max_eval_element(
    ForwardIt first,
    ForwardIt last,
    Evaluate eval,
    Compare comp
){
    if (first == last) return last;

    ForwardIt largest = first;
    auto largest_val = eval(*first);
    ++first;
    for (; first != last; ++first) {
        const auto this_val = eval(*first);
        if (comp(largest_val, this_val)) {
            largest = first;
            largest_val = this_val;
        }
    }
    return largest;
}

int main()
{

    std::array<Node, 10> nodes;

    counter = 0;
    Node const* nodePtr = max_eval_element(std::cbegin(nodes), std::cend(nodes),
                                       [](Node const& node){ return node.Score(); },
                                       [](double const &a, double const &b) {
                                           return a<b;
                                       });
    std::cout << "algorithm count " << counter << std::endl;

    counter = 0;
    double maxScore = -FLT_MAX;
    for (const auto& node : nodes) {
        auto score = node.Score();
        if (score > maxScore) {
            maxScore = score;
            nodePtr = &node;
        }
    }
    std::cout << "raw loop count " << counter << std::endl;
}

在这种情况下，两个循环执行相同数量的评估。

我使用过的许多内部代码库都有扩展 STL 的扩展库。它让我工作过的团队更加确信他们的代码已正确编写，并允许您一目了然地解释复杂的操作。这样一来，这些抽象也减少了理解代码的工作量和沟通的工作量。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++“无原始循环”而不损失性能的相关文章

使用 Unity 在构造函数中使用属性依赖注入

好的我在基类中定义了一个依赖属性我尝试在其派生类的构造函数内部使用它但这不起作用该属性显示为 null Unity 在使用 container Resolve 解析实例后解析依赖属性我的另一种选择是将 IUnityContaine
VB.NET 相当于 C# 属性简写吗？

是否有与 C 等效的 VB NET public string FirstName get set 我知道你能做到 Public Property name As String Get Return name ToString End Ge
如何在 C# 中从 UNIX 纪元时间转换并考虑夏令时？

我有一个从 unix 纪元时间转换为 NET DateTime 值的函数 public static DateTime FromUnixEpochTime double unixTime DateTime d new DateTime 19
如何将 #ifdef DEBUG 添加到 Xcode？

我的项目中有一些代码永远不应该在发布版本中使用但在测试时很有用我想做这样的事情 ifdef DEBUG Run my debugging only code endif 在 Xcode 4 中哪里添加 DEBUG 设置我尝试将其放入
如何修复此错误“GDI+ 中发生一般错误”？

从默认名称打开图像并以默认名称保存覆盖它我需要从 Image Default jpg 制作图形将其放在 picturebox1 image 上并在 picurebox1 上绘制一些图形它有效这不是我的问题但我无法保存 pictu
XamlReader.Load 在后台线程中。是否可以？

WPF 应用程序具有从单独的文件加载用户控件的操作使用XamlReader Load method StreamReader mysr new StreamReader pathToFile DependencyObject rootOb
单元测试一起运行时失败，单独运行时通过

所以我的单元测试遇到了一些问题我不能只是将它们复制并粘贴到这里但我会尽力而为问题似乎是如果我一项一项地运行测试一切都会按预期进行但如果我告诉它一起运行测试则 1 5 将通过 TestMethod public void Obj
如何从 .resx 文件条目获取注释

资源文件中的字符串有名称值和注释 The ResXResourceReader类让我可以访问名称和值有办法看评论吗你应该能够得到Comment via ResXDataNode class http msdn microsoft co
生成（非常）大的非重复整数序列而不进行预洗牌

背景我编写了一个简单的媒体客户端服务器我想生成一个不明显的时间值随从客户端到服务器的每个命令一起发送时间戳中将包含相当多的数据纳秒分辨率即使它不是真正准确因为现代操作系统中计时器采样的限制等我想做的在 Linux 上
用于检查项目文件中的项目变量和引用路径的 api

我正在研究一个 net application VS2010 与 x 没有解和变量号这些解决方案中的项目数量我需要检查项目属性特定于一定数量的项目是否同质并且检查验证构建期间的参考路径有没有一个API是这样的吗如果没有我该
PlaySound 可在 Visual Studio 中运行，但不能在独立 exe 中运行

我正在尝试使用 Visual Studio 在 C 中播放 wav 文件我将文件 my wav 放入项目目录中并使用代码 PlaySound TEXT my wav NULL SND FILENAME SND SYNC 我按下播放按钮或
如何使用 watin 中的 FileUploadDialogHandler 访问文件上传对话框

我正在使用 IE8 和 watin 并尝试通过我的网页测试上传文件我不能简单地使用 set 方法设置上传文件例如 ie FileUpload Find ById someId Set C Desktop image jpg 因为上传文本
上下文敏感与歧义

我对上下文敏感性和歧义如何相互影响感到困惑我认为正确的是歧义歧义语法会导致使用左推导或右推导构建多个解析树所有可能的语法都是二义性的语言是二义性语言例如 C 是一种不明确的语言因为 x y 总是可以表示两个不同的事物如下所述
如何将自定义 JSON 文件添加到 IConfiguration 中？

我正在使用 asp net Autofac 我正在尝试加载自定义 JSON 配置文件并基于该文件创建实例化 IConfiguration 实例或者至少将我的文件包含到默认情况下构建的 IConfiguration asp net 中
如何使用 Mongodb C# 驱动程序连接多个集合

我需要将 3 个集合与多个集合合并在一起 lookup我在 C 驱动程序中尝试过它允许我 lookup用户采集但无法执行秒 lookup用于设置集合有人可以帮忙吗 db Transactions aggregate lookup fro
将 log4net 与 Autofac 结合使用

我正在尝试将 log4net 与 Autofac 一起使用我粘贴了这段代码http autofac readthedocs org en latest examples log4net html http autofac readthed
等待线程完成

private void button1 Click object sender EventArgs e for int i 0 i lt 15 i Thread nova new Thread Method nova Start list
std::async 与重载函数

可能的重复 std bind 重载解析 https stackoverflow com questions 4159487 stdbind overload resolution 考虑以下 C 示例 class A public int f
如何将 Roslyn 语义模型返回的类型符号名称与 Mono.Cecil 返回的类型符号名称相匹配？

我有以下代码 var paramDeclType m semanticModel GetTypeInfo paramDecl Type Type Where paramDeclType ToString returns System Col
当另一个线程可能设置共享布尔标志（最多一次）时，是否可以读取共享布尔标志而不锁定它？

我希望我的线程能够更优雅地关闭因此我尝试实现一个简单的信号机制我不认为我想要一个完全事件驱动的线程所以我有一个工作人员有一种方法可以使用关键部分优雅地停止它Monitor 相当于C lock我相信绘图线程 h class Drawi

随机推荐

Tweepy：现在可以使用 Twitter 搜索 api 获取旧推文了吗？

根据http www theverge com 2014 11 18 7242477 twitter search now lets you find any tweet ever sent http www theverge com 20
使用批处理文件按键盘按键[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我正在尝试开发一个批处理文件它可以自动按向左箭头和向右箭头键 n 次中间有一些暂停有人可以帮我解决这个问题吗 P
如何避免在 Scala 中调用 asInstanceOf

这是我的代码的简化版本怎样才能避免打电话asInstanceOf 因为这是一个设计不佳的解决方案的味道 sealed trait Location final case class Single bucket String extends
使用框架会妨碍我掌握 JavaScript 吗？

如果我一直用框架自己什么都不做我怎么能成为 JavaScript 高手呢我问了一个关于 JavaScript 的问题每个人都建议我使用框架它不会向我展示 JS 的真正核心而不是手动编码你在自己发现JS的时候有没有编写自己的所谓
JavaFX 嵌套控制器 (FXML )

In this http docs oracle com javafx 2 api javafx fxml doc files introduction to fxml html nested controllers教程中有一个示例说明如
PHP foreach 循环中的多个索引变量

是否有可能有一个foreach在 PHP 中使用多个索引变量循环类似于以下内容未使用正确的语法 foreach courses as course sections as section 如果没有有没有好的方法可以达到相同的结果
springboot + webpack 开发服务器，重建后不会更改 localhost 捆绑文件

点击这张图片请阅读下面的内容 https i stack imgur com BYXDA png 1 第一张图片是运行 webpack dev server hot inline 之后的第二张图片是我的html 我调用js文件的方式我
如何在 Xcode 8/Swift 3 中创建 iOS liveView [重复]

这个问题在这里已经有答案了我不知道如何在 Xcode 8 Swift 3 Playground 中创建和显示实时视图如果 Apple 有关于 Playground 和实时视图的综合文档我找不到它而且我所有的在线搜索都显示 Xcode
为什么OpenGL最初要设计成状态机？[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
处理 RequireJS require 函数中的先决条件加载失败

我正在使用 AMD 的 RequireJS 使用这段代码我在确保module1已加载 require module1 function module1 if module1 My function code 在某些情况下module1不可
如何使用 ClientID 和 ClientSecret 在 Phonegap 内使用 Angularjs 登录 Google OAuth2

我正在尝试使用 Angularjs 使用 Ionic 框架通过 Google OAuth2 从我的 Phonegap 应用程序登录目前我正在使用http phonegap tips com articles google api oau
Android蓝牙RSSI值总是返回-32768？

我试图通过单击按钮获取已连接蓝牙设备的当前 RSSI 值然而它总是只返回 32768 不知道出了什么问题不过我在第一次连接时就能够获得正确的 RSSI private Button OnClickListener buttonRSSI
如何在反应本机模式中调暗背景？

以下是我创建的反应本机模态但仍然找不到如何调暗背景并在弹出模态周围透明我没有使用任何外部库并试图在没有库的情况下找到解决方案是否可以用这种方式来做我的模态组件 render let modal this state modalTy
Xpath 获取第二个 url 以及 href 标签中的匹配文本

一个html页面有分页链接 1个设置在页面顶部另一个设置在页面底部使用 HtmlUnit 我目前正在使用页面上获取 HtmlAnchorgetByAnchorText 1 顶部的某些链接存在问题因此我想使用 XPath 引用底部链接
svn 与 git 浅（稀疏）签出 - 分支、提交

我有一个非常大的网络项目有很多 pdf 图像 php 文件我将文件作为单个项目导入到 svn 中我使用 svn 浅签出来签出子树的一部分然后使用工作副本中的分支和标记等来节省空间并加快签出时间我想知道这是否可以用 git 实现我
如何在IOS7中使#key和@key可点击

任何人都知道如何在 IOS7 中的评论文本中使 KEY 和 NAME 可点击例如 instagram 的做法相同我正在尝试使用 NSMutableAttributedString 但我不确定如何检测单击事件在下图中单击 Usernam
Windows 上与 taglib 的链接错误

I built taglibWindows 的静态库如下必须使用mingw 而不是VS 查看git clone https github com taglib taglib git git taglib 已安装cmake使用来自 cmak
用C++设计事件机制

我试图在 C 中设计一个通用的但有些特定于用例的事件传递机制而不违背新风格 C 的原则同时又不过度使用模板我的用例有些特殊因为我需要完全控制事件的分发时间事件系统是世界模拟的基础其中世界的每次迭代都会作用于前一帧生成的事件
使用 BOOST 进程在单独的线程中读取子进程标准输出

我有一个主程序它使用 boost 进程库来生成一个打印的子进程 Hello World 每 5 秒在其标准输出上一次我想在主进程中的子进程的标准输出可用时读取监视它并在主程序中执行其他操作我已经尝试过这些例子boost async
C++“无原始循环”而不损失性能

所以新旧大事是 C 中的无原始循环我正在尝试以这种方式编写代码但似乎效率很低是的有些 STL 算法可以做任何事情但它们似乎效率不高例如我有一种情况我想要一个指向节点数组中得分最高的节点的指针确定该分数是一项代价高

C++“无原始循环”而不损失性能

C++“无原始循环”而不损失性能 的相关文章

随机推荐

热门标签

C++“无原始循环”而不损失性能的相关文章