【C++】Eigen优化及D8016错误

2023-05-16

Eigen优化过程

背景

最近在写一个保边滤波的算法。为了加快运算速率，采用C++语言，使用Eigen库进行大矩阵运算。

效率问题

作为基于全局图像的算法，需要创建一个全局的矩阵（n*m在数千万到数亿的级别），但是，有效数据大约只有数十万级别，也就是说这是一个不折不扣的稀疏矩阵。因此，我们所有的矩阵运算都是基于Eigen::SparseMatrix

对于矩阵的构建，常用的有以下几种方法。

直接给稀疏矩阵（SparseMatrix赋值）
```
Eigen::SparseMatrix<double> sparse(rows,cols);
sparse.insert(row, col, num);  //如果数据不存在 
sparse.coeffRef(row,col,num);  //如果数据已经存在
```
经过测试，在没有数据的情况下，insert()和coeffRef()，不论从效率上，还是从效果上，基本没有什么大的差别。

在实际运行过程中，这种写法是效率最差的一种。20W+的数据跑了1分钟没出结果，果断停了。我们是要做到毫秒级的！！！

使用三元组初始化稀疏矩阵

typename Eigen::Triplet<double> TD;
vector<TD> tripletList;
tripletList.reserve(N);
for(int i=0;i<N;i++;){
    tripletList.push_bach(TD(row,col,num));   //push 操作效率低的离谱
}
Eigen::SparseMatrix<double> sparse(rows,cols);
sparse.setFromTriplet(tripletList.begin(),tripletList.end());  // 这就是为什么我不喜欢用vector，又不得不用的原因
if(!m_sparseB.isCompressed())   //判断是否有多余的空间需要压缩
	m_sparseB.makeCompressed();

代码简洁明了，不多做解释。

在实际运行过程中，这种官方推荐，且被大量使用的写法，效率上依旧是不能满意（20W+的数据，跑7S）。接下来，我们深入探究一下这个原因。

探究及优化

vector::push_back()是个性能非常的差。

void fVector() {    //0.413247
    vector<int> vec;
    for (size_t i = 0; i < 2000000; i++) {
        vec.push_back(i);
    }
}
void fvecSize() {   //0.0406735
    vector<int> vec(2000000);
    for (size_t i = 0; i < 2000000; i++) {
        vec[i] = i;
    }
}
void farray() {   //0.0091637
    int* vec = new int[2000000];
    for (size_t i = 0; i < 2000000; i++) {
        vec[i] = i;
    }
    delete[] vec;
}

在实际测试中，200W的数据，跑出了0.4s，的成绩。
提前分配内存，使用 = 操作，时间消耗只有0.04s。性能差了10倍！！！
直接使用数组，则只需要0.009s

综上：我要干掉push操作

setFromTriplet是需要编译器优化的

干掉push之后，效率问题依旧没有得到明显的改变。经过分析，setFromTriplet跑了6S+，我再一次陷入沉思。因为，同样的逻辑，大兄弟跑出了1.3s的骄人成绩。他还是做了大量矩阵计算的前提下，而我，只是得到了两个矩阵，还没有进行计算。

经过我虚心请教，得到两个可以极大提升效率的优化操作：
1. 开启VS的优化设置
  
  根据自己需要，选择时间优先，或者空间优先。
  
  选择之后，需要关闭编译时的检查，否则会D8016报错。
  
  把运行时检查选为默认值即可。
2. 用release跑
  
  在我跑的代码中，release版本比debug 效率提升大概4倍左右。

VS D8016

D8016 “/Ox”和“/RTC1”命令行选项不兼容

关于该错误，详细了解可看官方文档

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Eigen

D8016

【C++】Eigen优化及D8016错误的相关文章

将 Eigen 库与 OpenCV 2.3.1 结合使用

我使用时遇到问题Eigen3图书馆连同OpenCV应用在C 我已经使用以下命令在 Ubuntu 上安装了 Eigen3 库 sudo apt get install libeigen3 dev 我能够编译和使用Eigen3 应用程序示例 E
Eigen3 根据列条件选择行

我的特征矩阵有一个二维矩阵例如 122 443 544 456 0 9 324 435 5465 645 0 8 32 434 545 546 0 778 435 546 6565 656 0 6878 546 6565 656 3453
如何使用OpenCV进行LU分解？

cvInvert 方法采用标志 CV LU 进行 LU 分解以反转输入矩阵但是有什么方法可以获得计算过程中形成的 L 和 U 矩阵吗为 LU 分解编写一个新函数似乎毫无意义因为 OpenCV 已经为其优化了代码不幸的是 OpenCV
eigen 是否有像 H.transpose()*H 这样的自转置乘法优化

我浏览过 eigen 的教程https eigen tuxfamily org dox devel group TutorialMatrixArithmetic html 它说注意对于担心性能的 BLAS 用户 c noalias 2
在 Apple M1 上使用 clang 出现“致命错误：找不到‘omp.h’文件”

Clang 找不到omp h每当我尝试使用 openMP 标志进行编译时这就是我想做的 clang dynamiclib I opt homebrew Cellar eigen 3 3 9 include eigen3 Xpreproce
在 MEX 函数中将特征复数矩阵返回到 MATLAB，无需额外复制

这个问题演示如何使用映射对象将双精度矩阵返回到 MATLAB 以下适用于非复杂数据 double outputPtr plhs 0 mxCreateDoubleMatrix mwSize n mwSize m mxREAL outputPt
std::vector 的对齐问题

我终于遇到了这里描述的烦人的问题 https eigen tuxfamily org dox group TopicStlContainers html 我有一个包含多个特征固定大小矩阵的结构并且我想将结构的多个实例存储在 std vec
稠密对称矩阵的特征有效类型

Does Eigen http eigen tuxfamily org index php title Main Page有存储密集固定大小对称矩阵的有效类型吗嘿它们无处不在 IE 对于 N 9 它应该只存储 1 9 9 2 45
eigen3 与 libfmt >= 9.0

我曾经能够将 Eigen3 数组矩阵传递给 spdlog 它内部使用 libfmt 从 libfmt 9 0 0 开始这些类型不再由 libfmt 格式化无需进一步的代码 fmt 通过专门化支持自定义类型fmt formatter
在 Android 中使用 iBeacons 进行三边测量

我们希望使用 iBeacons 实现某种室内位置确定这篇文章看起来真的很有趣 http techblog rga com determining indoor position using ibeacon 其中作者使用 Eigen C 库
如何复制特征矩阵

我有两个Eigen MatrixXd他们总是有一排输入矩阵是A我想将这个矩阵复制到另一个矩阵中B 但矩阵之间的列数可以不同下面是一个例子 A 0 5 我需要创建一个B1行4列的矩阵因此它是 B 0 5 0 5 0 5 0 5 But
Eigen：返回对带有编译时维度检查的矩阵块的引用

我要问的是一个概括这个问题 https stackoverflow com questions 13548253 eigen library return a matrix block in a function as lvalue 具体来
C++ 对齐的未来：按值传递？

阅读 Eigen 库文档我注意到有些对象不能按值传递 http eigen tuxfamily org dox TopicPassingByValue html C 11 中是否有任何开发或计划开发可以安全地按值传递此类对象另外为什么
查找 CMake 的包 Eigen3

CMake 找不到我的Eigen3包裹我设置了一个名为的环境变量 EIGEN3 INCLUDE DIR 指向路径所在的位置FindEigen3 cmake is 然后在 CMakelists txt 中我写道 find package E
cygwin_exception::open_stackdumpfile：将堆栈跟踪转储到 *.exe.stackdump

我收到 cygwin exception open stackdumpfile 将堆栈跟踪转储到 TestProject exe stackdump 错误我的项目只不过是一个 C HalloWorld 项目其中包含一个附加类我在其中设
特征密集稀疏矩阵乘积是线程化的吗？

我知道稀疏密集产品是根据文档进行线程化的 https eigen tuxfamily org dox TopicMultiThreading html https eigen tuxfamily org dox TopicMultiThre
从模板类创建对象时出错

我一直在尝试找到一种方法从 C 中的多元正态分布中采样随机向量同时具有均值向量和协方差矩阵就像 Matlab 的那样mvnrnd功能有效我找到了实现此功能的类的相关代码这一页 http lost found wandering bl
Eigen 中的元素最大值和正部分

我想在特征中取两个向量矩阵的元素最大值到目前为止我已经编写了这段代码 template
将标量添加到特征矩阵（向量）

我刚刚开始使用 Eigen 库无法理解如何向所有矩阵成员添加标量值假设我有一个矩阵 Eigen Matrix3Xf mtx Eigen Matrix3Xf Ones 3 4 mtx mtx 1 main cxx 104 13 error
模板成员函数和 std::invocable 的 C++20 概念中的错误

我正在尝试 C 20 概念和本征库 https eigen tuxfamily org index php title Main Page 我发生了意想不到的行为具体来说考虑以下概念要求类型可以通过以下任一方式调用 Eigen Mat

随机推荐

Xilinx 7 Series/UltraScale GTX/GTH动态速率配置

Xilinx transceiver动态修改速率计算工具 xff0c 支持的平台 xff1a 界面 xff1a
华为手机打开图片很慢是怎么回事_华为手机拿去维修，记得打开这个功能，能够保护隐私...

相信很多人都在用华为手机 xff0c 强大的性能让花粉们所青睐 xff0c 如果你的华为手机需要拿去维修 xff0c 那么记得打开下面这个功能 xff0c 防止秘密被查看一启用文件加密 1 手机拿去维修 xff0c 又担心隐私被偷看 x
linux图片转gcode软件,simple-gcode-generators

Simple G Code Generators This repository contains a collection of Python scrips that generate simple G Code for LinuxCNC
linux下的绑核命令,Linux下的绑核命令——taskset

什么是绑核所谓绑核 xff0c 其实就是设定某个进程线程与某个CPU核的亲和力 affinity 设定以后 xff0c Linux调度器就会让这个进程线程只在所绑定的核上面去运行但并不是说该进程线程就独占这个CPU的核 xff0c
普联无线网卡支持linux,linux(debian)安裝USB無線網卡(tp-link TL-WN725N rtl8188eu )

1 台式機家里面不想再走線了於是去某東買了個USB無線網卡 tp的WN725N USB 非常小和羅技的優聯接收器差不多大 2 驅動能自己識別是不指望了 xff0c 既然是usb網卡 xff0c 插入USB后 xff0c 那就lsusb
oracle加索引 oracle,Oracle之索引(Index)实例讲解 - 基础

Oracle索引 Index 是关系数据库中用于存放表中每一条记录位置的一种对象 xff0c 主要目的是加快数据的读取速度和数据的完整性检查索引的建立是一项技术性要求非常高的工作一般在数据库设计阶段就要考虑到如何设计和创建索引 1 创建
Centos 防火墙命令

1 执行防火墙关闭命令 xff1a systemctl stop firewalld service 开启 systemctl start firewalld service 2 再次执行查看防火墙状态命令 xff1a systemctl
9 怎么登录VNC

1 xff09 首先在ssh登录后启动vncserver 登陆后输入下面的指令来创建自己的VNC 命令vncserver 16 geometry 1900x1000 其中 xff1a 16是分配的端口号 xff0c 1900x1000是分辨
linux与freertos区别,谈谈uCOS和freeRTOS这两种实时系统的结构以及编程思想

距离上次总结 xff0c 已经过去有差不多半年了 xff0c 最近又到了自己半年一次的总结了首先说说自己的编程风格的变化 xff0c 在上一篇第三篇文中提到的数据结构配置文件结构预编译结构 xff0c 目前已经逐渐适应 xff0c
linux16.04怎木改中文,【Linux】Ubuntu 16.04 安装搜狗中文输入法安装

本文记录在 Ubuntu16 04 下安装搜狗中文输入法过程文章目录 1 安装 fcitx 1 1 配置源 1 2 命令行安装fcitx 1 3 命令行安装相关工具 2 系统语言设置 2 1 安装中文支持 2 2 配置 fcitx 3 安
arm-linux环境下安装opencv,编译OpenCV for Arm-Linux

OpenCV是Intel支持的开源计算机视觉库它由一系列C函数和少量C 43 43 类构成 xff0c 实现了图像处理和计算机视觉方面的很多通用算法它不依赖于其它的外部库尽管也可以使用某些外部库 OpenCV使用BSD License
判断任意两台计算机的ip地址是否属于同一子网络 c语言,判断任意两台计算机的IP地址是否属于同一子网络...

include 34 OJ h 34 include include using namespace std 功能判断两台计算机IP地址是同一子网络原型 xff1a int IsSameSubNetwork char pcIp1 cha
python mapreduce框架_Python实现mapreduce程序

一 xff1a 目的之前面试曾遇到面试官让用python代码实现mapreduce中最简单的demo WordCount 由于之前一直用java来写hadoop程序 xff0c 突然转到python xff0c 是我产生了质疑 xff0c
计算机c 逻辑符号,c语言基本符号

C 43 43 既可用于面向过程的结构化程序设计 xff0c 又可用于面向对象的程序设计 xff0c 是一种功能强大的混合型的程序设计语言下面是小编收集的关于c语言基本符号 xff0c 希望大家认真阅读运算符的种类C语言的运算符可分为以
c语言中特殊符号怎么定义,C语言特殊符号意义

C语言特殊符号意义由会员分享 xff0c 可在线阅读 xff0c 更多相关 C语言特殊符号意义 17页珍藏版请在人人文库网上搜索 1 下载可编辑C 语言中像 D amp f符号的作用说一下最佳答案C 语言中的符号运算符的种类 C 语言的
11 项目的工程文件存在哪里

项目的工程文件都存在SVN服务器上 xff0c 在日常开发中 xff0c 一定存在多人进行开发 xff0c 那么就会造成代码重合现象 xff0c SVN就是解决这种矛盾冲突的 xff0c SVN是从Linux下产生的一款C S模式的软件版本
vnc连接某个服务器显示10061,VNC connect:Connection refused(10061)(示例代码)

下面介绍一个VNC连接工具 xff1a iis7服务器管理工具 IIs7服务器管理工具可以批量连接并管理VNC服务器作为服务器集成管理器 xff0c 它最优秀的功能就是批量管理windows与linux系统服务器 vps 能极大的提高站长
linux安装软件sudo吗,安装软件包方式：sudo apt-get和sudo tasksel有何不同

要安装ubuntu desktop有什么方法 xff0c 比较方便的运行命令 xff0c 下面三条命令都成功的安装ubuntu desktop xff0c 即 xff1a sudo apt get install ubuntu deskto
牛客网中c++题目及其知识点详解

1 下面描述正确的是 1 2 int p1 61 new int 10 int p2 61 new int 10 p1和p2申请的空间里面的值都是随机值 p
【C++】Eigen优化及D8016错误

Eigen优化过程背景最近在写一个保边滤波的算法为了加快运算速率 xff0c 采用C 43 43 语言 xff0c 使用Eigen库进行大矩阵运算效率问题作为基于全局图像的算法 xff0c 需要创建一个全局的矩阵 xff08 n