连接两个向量同时转换一个向量的元素的最佳方法是什么？

2024-02-22

假设我有

std::vector<T1> vec1 {/* filled with T1's */};
std::vector<T2> vec2 {/* filled with T2's */};

和一些功能T1 f(T2)这当然可以是 lambda。连接的最佳方式是什么vec1 and vec2申请时f每一个T2 in vec2?

显而易见的解决方案是std::transform, i.e.

vec1.reserve(vec1.size() + vec2.size());
std::transform(vec2.begin(), vec2.end(), std::back_inserter(vec1), f);

但我说这是not最优为std::back_inserter必须进行不必要的容量检查每个插入的元素。最好的办法是这样的

vec1.insert(vec1.end(), vec2.begin(), vec2.end(), f);

只需进行一次容量检查即可。遗憾的是这不是有效的 C++。本质上这就是同样的原因std::vector::insert是向量串联的最佳选择，请参阅this https://stackoverflow.com/questions/201718/concatenating-two-stl-vectors?lq=1问题和评论this https://stackoverflow.com/questions/28528626/why-does-stdvectorinsert-need-to-copy-assign/28528872?noredirect=1#comment45373435_28528872就这一点进行进一步讨论的问题。

So:

Is std::transform使用STL的最佳方法？
如果是这样，我们可以做得更好吗？
是否有充分的理由insertSTL 中省略了上述函数吗？

UPDATE

我尝试验证多次容量检查是否确实有任何明显的成本。为此，我基本上只是传递 id 函数（f(x) = x）到std::transform and push_back答案中讨论的方法。完整代码是：

#include <iostream>
#include <vector>
#include <iterator>
#include <algorithm>
#include <cstdint>
#include <chrono>
#include <numeric>
#include <random>

using std::size_t;

std::vector<int> generate_random_ints(size_t n)
{
    std::default_random_engine generator;
    auto seed1 = std::chrono::system_clock::now().time_since_epoch().count();
    generator.seed((unsigned) seed1);
    std::uniform_int_distribution<int> uniform {};
    std::vector<int> v(n);
    std::generate_n(v.begin(), n, [&] () { return uniform(generator); });
    return v;
}

template <typename D=std::chrono::nanoseconds, typename F>
D benchmark(F f, unsigned num_tests)
{
    D total {0};
    for (unsigned i = 0; i < num_tests; ++i) {
        auto start = std::chrono::system_clock::now();
        f();
        auto end = std::chrono::system_clock::now();
        total += std::chrono::duration_cast<D>(end - start);
    }
    return D {total / num_tests};
}

template <typename T>
void std_insert(std::vector<T> vec1, const std::vector<T> &vec2)
{
    vec1.insert(vec1.end(), vec2.begin(), vec2.end());
}

template <typename T1, typename T2, typename UnaryOperation>
void push_back_concat(std::vector<T1> vec1, const std::vector<T2> &vec2, UnaryOperation op)
{
    vec1.reserve(vec1.size() + vec2.size());
    for (const auto& x : vec2) {
        vec1.push_back(op(x));
    }
}

template <typename T1, typename T2, typename UnaryOperation>
void transform_concat(std::vector<T1> vec1, const std::vector<T2> &vec2, UnaryOperation op)
{
    vec1.reserve(vec1.size() + vec2.size());
    std::transform(vec2.begin(), vec2.end(), std::back_inserter(vec1), op);
}

int main(int argc, char **argv)
{
    unsigned num_tests {1000};
    size_t vec1_size {10000000};
    size_t vec2_size {10000000};

    auto vec1 = generate_random_ints(vec1_size);
    auto vec2 = generate_random_ints(vec1_size);

    auto f_std_insert = [&vec1, &vec2] () {
        std_insert(vec1, vec2);
    };
    auto f_push_back_id = [&vec1, &vec2] () {
        push_back_concat(vec1, vec2, [] (int i) { return i; });
    };
    auto f_transform_id = [&vec1, &vec2] () {
        transform_concat(vec1, vec2, [] (int i) { return i; });
    };

    auto std_insert_time   = benchmark<std::chrono::milliseconds>(f_std_insert, num_tests).count();
    auto push_back_id_time = benchmark<std::chrono::milliseconds>(f_push_back_id, num_tests).count();
    auto transform_id_time = benchmark<std::chrono::milliseconds>(f_transform_id, num_tests).count();

    std::cout << "std_insert: " << std_insert_time << "ms" << std::endl;
    std::cout << "push_back_id: " << push_back_id_time << "ms" << std::endl;
    std::cout << "transform_id: " << transform_id_time << "ms" << std::endl;

    return 0;
}

编译为：

g++ vector_insert_demo.cpp -std=c++11 -O3 -o vector_insert_demo

Output:

std_insert: 44ms
push_back_id: 61ms
transform_id: 61ms

编译器将内联 lambda，这样就可以安全地降低成本。除非其他人对这些结果有可行的解释（或者愿意检查组件），否则我认为可以合理地得出多次容量检查的成本显着的结论。

更新：性能差异是由于reserve()调用，至少在 libstdc++ 中，使容量完全符合您的要求，而不是使用指数增长因子。

我做了一些计时测试，得到了有趣的结果。使用std::vector::insert随着boost::transform_iterator这是我发现的最快的方法：

版本1：

void
  appendTransformed1(
    std::vector<int> &vec1,
    const std::vector<float> &vec2
  )
{
  auto v2begin = boost::make_transform_iterator(vec2.begin(),f);
  auto v2end   = boost::make_transform_iterator(vec2.end(),f);
  vec1.insert(vec1.end(),v2begin,v2end);
}

版本2：

void
  appendTransformed2(
    std::vector<int> &vec1,
    const std::vector<float> &vec2
  )
{
  vec1.reserve(vec1.size()+vec2.size());
  for (auto x : vec2) {
    vec1.push_back(f(x));
  }
}

版本 3：

void
  appendTransformed3(
    std::vector<int> &vec1,
    const std::vector<float> &vec2
  )
{
  vec1.reserve(vec1.size()+vec2.size());
  std::transform(vec2.begin(),vec2.end(),std::inserter(vec1,vec1.end()),f);
}

Timing:



    Version 1: 0.59s
    Version 2: 8.22s
    Version 3: 8.42s

主要.cpp：

#include <algorithm>
#include <cassert>
#include <chrono>
#include <iterator>
#include <iostream>
#include <random>
#include <vector>
#include "appendtransformed.hpp"

using std::cerr;

template <typename Engine>
static std::vector<int> randomInts(Engine &engine,size_t n)
{
  auto distribution = std::uniform_int_distribution<int>(0,999);
  auto generator = [&]{return distribution(engine);};
  auto vec = std::vector<int>();
  std::generate_n(std::inserter(vec,vec.end()),n,generator);
  return vec;
}

template <typename Engine>
static std::vector<float> randomFloats(Engine &engine,size_t n)
{
  auto distribution = std::uniform_real_distribution<float>(0,1000);
  auto generator = [&]{return distribution(engine);};
  auto vec = std::vector<float>();
  std::generate_n(std::inserter(vec,vec.end()),n,generator);
  return vec;
}

static auto
  appendTransformedFunction(int version) ->
    void(*)(std::vector<int>&,const std::vector<float> &)
{
  switch (version) {
    case 1: return appendTransformed1;
    case 2: return appendTransformed2;
    case 3: return appendTransformed3;
    default:
      cerr << "Unknown version: " << version << "\n";
      exit(EXIT_FAILURE);
  }

  return 0;
}

int main(int argc,char **argv)
{
  if (argc!=2) {
    cerr << "Usage: appendtest (1|2|3)\n";
    exit(EXIT_FAILURE);
  }
  auto version = atoi(argv[1]);
  auto engine = std::default_random_engine();
  auto vec1_size = 1000000u;
  auto vec2_size = 1000000u;
  auto count = 100;
  auto vec1 = randomInts(engine,vec1_size);
  auto vec2 = randomFloats(engine,vec2_size);
  namespace chrono = std::chrono;
  using chrono::system_clock;
  auto appendTransformed = appendTransformedFunction(version);
  auto start_time = system_clock::now();
  for (auto i=0; i!=count; ++i) {
    appendTransformed(vec1,vec2);
  }
  auto end_time = system_clock::now();
  assert(vec1.size() == vec1_size+count*vec2_size);
  auto sum = std::accumulate(vec1.begin(),vec1.end(),0u);
  auto elapsed_seconds = chrono::duration<float>(end_time-start_time).count();

  cerr << "Using version " << version << ":\n";
  cerr << "  sum=" << sum << "\n";
  cerr << "  elapsed: " << elapsed_seconds << "s\n";
}

编译器：g++ 4.9.1

选项：-std=c++11 -O2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

连接两个向量同时转换一个向量的元素的最佳方法是什么？的相关文章

当从后台工作程序发生事件时，XlCall.Excel(XlCall.xlcCalculateNow) 抛出 XlCallException

我有一个 ExcelFunction 来排队一些计算 ExcelFunction public static void QueueCalcs takes ranges var calcRequests builds list of calc
C# 和月历，选择多个日期

我正在制作一个程序可以帮助人们用 C 为某个部门预订订单他们需要能够选择不同月份的多个日期我更愿意拥有它这样他们就可以单击一个日期然后按住 Shift 键单击另一个日期以选择这两个日期之间的所有日期并控制单击以进行单选取消
.pdbs 会减慢发布应用程序的速度吗？

如果 dll 中包含 pdb 程序调试文件则行号将出现在引发的任何异常的堆栈跟踪中这会影响应用程序的性能吗这个问题与发布与调试即优化无关这是关于拥有 pdb 文件的性能影响每次抛出异常时都会读取 pdb 文件吗加载程序集时
在 Mac OS X 上安装 libxml2 时出现问题

我正在尝试在我的 Mac 操作系统 10 6 4 上安装 libxml2 我实际上正在尝试在 Python 中运行 Scrapy 脚本这需要我安装 Twisted Zope 现在还需要安装 libxml2 我已经下载了最新版本 2 7 7
MSMQ接收和删除

是否有任何选项可以在读取消息后将其从 MSMQ 中删除比如接收删除可以作为原子操作运行吗听起来您想查看下一条消息然后在处理完成后接收它 Message message Queue Peek Queue ReceiveById me
DataGridView 列中的数字文本框

我有一个DataGridView 我想要它的第一列或任何所需的列其中有textboxes在其中成为NUMERIC ONLY 我目前正在使用这段代码 private void dataGridViewItems EditingContro
以下 PLINQ 代码没有改进

我没有看到使用以下代码的处理速度有任何改进 IEnumerable
类中是否可以有虚拟类声明？

我正在为个人项目中框架的各个组件设置一个接口我突然想到了一些我认为可能对接口有用的东西我的问题是这是否可能 class a public virtual class test 0 class b public a public clas
从时间列表中查找最接近的时间

所以这是场景我有一个带有创建时间的文件我想从该文件的创建时间最接近或相等的时间列表中选择一个时间完成此操作的最佳方法是什么 var closestTime listOfTimes OrderBy t gt Math Abs t fi
C 类型命名约定，_t 或 ALLCAPS

我一直想知道是否有任何命名约定例如何时对类型使用全部大写以及何时追加 t 什么时候不使用任何东西我知道当时 K R 发布了各种有关如何使用 C 的文档但我找不到任何相关内容在 C 标准库类型中 t看起来漂亮占主导地位 time t
检测 TextBox 中的 Tab 键按下

I am trying to detect the Tab key press in a TextBox I know that the Tab key does not trigger the KeyDown KeyUp or the K
编写具有多种类型的泛型扩展方法时的类型推断问题

我正在为 IEnumerable 编写一个通用扩展方法用于将对象列表映射到另一个映射对象列表这就是我希望该方法的工作方式 IList
如何在 EF Core 2.1 中定义外键关系

我的 DAL 使用 EF Core 2 1 这就是我的模型的样子一名用户只能拥有一种角色 Role entity kind of master public class Role public int RoleId get set pub
MSChart 控件中的自定义 X/Y 网格线

我有一个带有简单 2D 折线图的 C Windows 窗体我想向其中添加自定义 X 或 Y 轴标记并绘制自定义网格线例如以突出显示的颜色虚线我查看了 customLabels 属性但这似乎覆盖了我仍然想显示的默认网格这是为了
在 mvc4 中创建通用 mvc 视图

我以前也提过类似的问题没有得到答案如何创建一个通用的 mvc4 视图该视图可以显示传递给它的模型列表或单个模型模型可以是个人组织或团体无论传递给它的是什么如果您正在寻找类似的东西 model MyViewModel
使用 Unity 在 C# 中发送 http 请求

如何使用 Unity 在 C 中发送 HTTP GET 和 POST 请求我想要的是在post请求中发送json数据我使用Unity序列化器所以不需要新的我只想在发布数据中传递一个字符串并且能够将 ContentType 设置
在二进制数据文件的标头中放入什么

我有一个模拟可以读取我们创建的大型二进制数据文件 10 到 100 GB 出于速度原因我们使用二进制这些文件依赖于系统是从我们运行的每个系统上的文本文件转换而来的所以我不关心可移植性当前的文件是 POD 结构的许多实例使用 f
值和类型的简洁双向静态 1:1 映射

我将从我想象如何使用我想要创建的代码开始它不必完全像这样但它是我在标题中所说的简洁的一个很好的例子就我而言它是将类型映射到相关的枚举值 struct bar foo
IDisposable 的显式实现

虽然有很多关于IDisposable在 SO 上找到我还没有找到答案我通常遵循这样的做法当我的一个班级拥有一个IDisposable对象然后它也实现IDisposable并打电话Dispose在拥有的对象上然而最近我遇到了一个类它
如何在c中断言两个类型相等？

在 C 中如何断言两种类型相等在 C 中我会使用 std is same 但搜索 StackOverflow 和其他地方似乎只能给出 C 和 C 的结果在C中没有办法做到这一点吗请注意这不是询问变量是否具有某种类型而是询问两个类

随机推荐

Maven 构建配置文件激活

我知道有一些相关的主题但我仍然不明白该怎么做我正在学习 Maven 目前正在创建构建配置文件我希望 Maven 自动检测我的机器上当前安装的 java 版本假设我在我们的办公室工作使用 jdk7 或家 jdk8 我想要
捆绑包无效负载原因：0x80070570

维克斯 3 6 我正在尝试运行捆绑包
Python将列表重塑为ndim数组

您好我有一个长度为 2800 的平面列表它包含 28 个变量中每个变量的 100 个结果下面是 2 个变量的 4 个结果的示例 0 0 1 1 2 2 3 3 我想将列表重塑为数组 2 4 以便每个变量的结果都在单个元素中 0 1 2
是否可以在 postgresql 命令中引用环境变量？

例如假设我想从运行 postgres 服务器的同一台计算机上的路径导入 CSV 文件有一个环境变量MyPath在系统上设置为 path to my csv file 我可以轻松导入此 CSV 文件如下所示 COPY MyTable F
Python 中 *tuple 和 **dict 是什么意思？ [复制]

这个问题在这里已经有答案了正如 PythonCookbook 中提到的可以添加在元组之前什么是意思是这里第 1 18 章将名称映射到序列元素 from collections import namedtuple Stock na
Weblogic 12c (12.1.3) - 字符串索引超出范围：51968

我正在尝试部署一个Spring BootWeblogic 12 1 3 上的 Web 应用程序当我从控制台部署时我收到以下错误在应用程序上 Message icon Error Unable to access the selecte
如何区分页面刷新和关闭页面

我有一个网络应用游戏在游戏中我想拥有它这样如果用户关闭页面或浏览器它会自动注销我尝试使用附加到窗口的 onbeforeunload 事件 window onbeforeunload function perform logout f
WCF / WebService充当MQ消息的侦听器？

也许我找错了方向但我有一组服务 WebAPI 和 WCF 它们使用 WebSphere MQ 与其他系统交互这没有问题直到我现在需要找到一种方法listening对于队列之一上的消息这是否可能或者我是否需要走 Windows 服务
Retrofit 2.0：无法为类创建调用适配器

我正在使用 Retrofit 2 0 beta1 如何发出简单的同步请求并将 JSON 响应反序列化为 POJO 列表这是我的界面 public interface ArticlesAPI GET articles List
Python递归挑战[已关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我目前正在上Python和计算理论入门课最近期中考试中有一道难题我根本无法解决它涉及为添加数字的程序编写代码我相信这个问题应该使
通过 api 访问 Wikimedia Commons 上的版权信息

我想使用 MediaWiki API 来获取图像的版权信息当您单击维基百科中的图像时将打开包含该图像的页面其中包含更多详细信息按钮单击此按钮您将进入一个包含在网络上使用此文件链接的页面单击此链接运行脚本 stockPh
C# 中析构函数有必要吗？

我有一个担忧我是计算机科学专业的一年级学生通常我在课堂上很好奇但老师并不总是有答案或者并不总是知道答案 C 中析构函数有必要吗我的意思是如果我必须像通常对构造函数那样实现析构函数方法这是一个好的做法还是我可以避免它并且垃圾收集
macOS 钥匙串 ACL 如何确定哪些应用程序具有访问权限？

当应用程序将项目保存到钥匙串时 macOS 会将该应用程序添加到访问控制列表中以便您的应用程序稍后可以访问它如果您尝试从其他应用程序访问该项目 macOS 将显示系统提示询问用户是否允许访问这是有记录的here https deve
sockaddr_in 未声明的标识符

我正在遵循 beej 的网络指南进展非常顺利因为我对一切都很了解而且他解释得很好然而当我想测试他向我展示的一些很酷的东西时这是行不通的我不确定 sockaddr in 到底在哪里声明但也许这里有人会帮助我这是我到目前为止所
Office 文档提示登录匿名 SharePoint 网站

我有一个配置为匿名访问的 MOSS 07 站点该站点内有一个文档库也启用了匿名访问当匿名用户单击该库中的 PDF 文件时他或她可以毫无问题地阅读或下载该文件当用户单击 Office 文档时系统会提示他或她登录框用户可以在不登录
内联 MSIL/CIL

我创建了以下简单方法 public static void Main Console WriteLine Hello world Console ReadKey true 然后我使用ILSpy获取MSIL代码 method public h
System.InvalidOperationException：无法解析类型依赖注入.net core web api的服务

System InvalidOperationException 尝试激活 Pwc EMSWebapi UserManagementController 时无法解析类型 Pwc EMSWebapi IUserManagementServic
如何从一组用户中提取电子邮件

If I do User all pluck email 然后就可以正常工作了但如果我这样做 arr Array new arr User all and then arr pluck email 这引发了以下错误 undefined m
重写构造函数类

下面是我的代码我不明白这是什么错误有谁可以指导一下吗 class State static String country static String capital State Constructor country America s
连接两个向量同时转换一个向量的元素的最佳方法是什么？

假设我有 std vector

连接两个向量同时转换一个向量的元素的最佳方法是什么？

连接两个向量同时转换一个向量的元素的最佳方法是什么？ 的相关文章

随机推荐

热门标签

连接两个向量同时转换一个向量的元素的最佳方法是什么？的相关文章