计算卷积的最快方法

2024-01-25

有人知道计算卷积最快的方法吗？不幸的是，我处理的矩阵非常大（500x500x200），如果我使用convn在 MATLAB 中，这需要很长时间（我必须在嵌套循环中迭代此计算）。所以，我使用了 FFT 卷积，现在速度更快了。但是，我仍在寻找更快的方法。任何想法？

如果您的内核是可分离的，则通过执行多个连续的一维卷积将实现最大的速度增益。

MathWorks 的 Steve Eddins 描述了当内核在 MATLAB 上下文中可分离时，如何利用卷积的结合性来加速卷积his blog http://blogs.mathworks.com/steve/2006/10/04/separable-convolution/. For a P-by-Q核，执行两个单独且连续的卷积与 2D 卷积相比的计算优势是PQ/(P+Q)，这对应于 9x9 内核的 4.5x 和 15x15 内核的约 11x。EDIT：对这种差异的一个有趣的、无意的演示在本次问答 https://stackoverflow.com/questions/19283894/imfilter-speed-for-volumes.

要确定内核是否可分离（即两个向量的外积），博客继续描述 http://blogs.mathworks.com/steve/2006/11/28/separable-convolution-part-2/如何检查您的内核是否可与 SVD 分离以及如何获取一维内核。他们的示例是 2D 内核。对于 N 维可分离卷积的解决方案，请检查此 FEX 提交 http://www.mathworks.com/matlabcentral/fileexchange/27957-separable-n-dimensional-convolution.

另一个值得指出的资源是Intel 的 3D 卷积 SIMD (SSE3/SSE4) 实现 http://software.intel.com/en-us/articles/16bit-3d-convolution-sse4openmp-implementation-on-penryn-cpu，其中包括source http://software.intel.com/sites/default/files/96/15/conv3d.zip and a 推介会 http://software.intel.com/sites/default/files/72/18/convol3d16bit.ppt。该代码适用于 16 位整数。除非你转向 GPU（例如cuFFT https://developer.nvidia.com/cuFFT），可能很难比英特尔的实现更快，其中还包括英特尔MKL http://software.intel.com/en-us/articles/the-intel-math-kernel-library-and-its-fast-fourier-transform-routines。底部有一个3D卷积（单精度浮点数）的例子MKL 文档的此页 https://software.intel.com/en-us/node/471390（链接已修复，现在镜像在https://stackoverflow.com/a/27074295/2778484 https://stackoverflow.com/a/27074295/2778484).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

计算卷积的最快方法的相关文章

进程何时获得 SIGABRT（信号 6）？

C 中进程获得 SIGABRT 的场景有哪些该信号是否始终来自进程内部或者该信号可以从一个进程发送到另一个进程吗有没有办法识别哪个进程正在发送该信号 abort 向调用进程发送SIGABRT信号就是这样abort 基本上有效 abo
为什么我不能用 `= delete;` 声明纯虚函数？

Intro 纯虚函数使用通用语法声明 virtual f 0 然而自 c 11 以来有一种方法可以显式地传达non existence 特殊成员函数的 Mystruct delete eg default constructor Q
向 ExpandoObject 添加方法时，“关键字 'this' 在静态属性、静态方法或静态字段初始值设定项中无效”

我尝试向 ExpandoObject 添加一个动态方法该方法将返回属性动态添加给它但它总是给我错误我在这里做错了什么吗 using System using System Collections Generic using Sys
如何在 Android NDK 中创建新的 NativeWindow 而无需 Android 操作系统源代码？

我想编译一个 Android OpenGL 控制台应用程序您可以直接从控制台启动 Android x86 运行或者从 Android x86 GUI 内的 Android 终端应用程序运行这个帖子如何在 Android NDK 中创
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
显示异常时的自定义错误消息：从客户端检测到潜在危险的 Request.Form 值

我在我的 Web 应用程序中使用 ASP NET 的登录控件当发生此异常时我想在标签上显示一种有趣的错误类型System Web HttpRequestValidationException A potentially dangerou
C++ 异步线程同时运行

我是 C 11 中线程的新手我有两个线程我想让它们同时启动我可以想到两种方法如下然而似乎它们都没有按照我的预期工作他们在启动另一个线程之前启动一个线程任何提示将不胜感激另一个问题是我正在研究线程队列所以我会有两个消费者和
如何从 C# 控制器重定向到外部 url

我使用 C 控制器作为网络服务在其中我想将用户重定向到外部网址我该怎么做 Tried System Web HttpContext Current Response Redirect 但没有成功使用控制器的重定向 http msdn
如何将“外部模板”与由同一类中的模板化成员使用的嵌套类一起使用？

首先一些背景信息我尝试以 Herb Sutter 在他的解决方案中介绍的方式使用 Pimpl 习语得到了 101 http herbsutter com gotw 101 这在头文件中看起来像这样 include pimpl h h
将数据打印到文件

我已经超载了 lt lt 运算符使其写入文件并写入控制台我已经为同一个函数创建了 8 个线程并且我想输出 hello hi 如果我在无限循环中运行这个线程例程文件中的o p是 hello hi hello hi hello hi e
Azure 事件中心 - 按顺序接收事件

我使用下面的代码从 Azure Event Hub 接收事件 https learn microsoft com en us azure event hubs event hubs dotnet framework getstarted s
通过 NHibernate 进行查询，无需 N+1 - 包含示例

我有一个 N 1 问题我不知道如何解决它可以在这个问题的底部找到完全可重复的样本因此如果您愿意请创建数据库设置 NUnit 测试和所有附带的类并尝试在本地消除 N 1 这是我遇到的真实问题的匿名版本众所周知这段代码对于帮助
如何一步步遍历目录树？

我发现了很多关于遍历目录树的示例但我需要一些不同的东西我需要一个带有某种方法的类每次调用都会从目录返回一个文件并逐渐遍历目录树请问我该怎么做我正在使用函数 FindFirstFile FindNextFile 和 FindClo
System.Runtime.InteropServices.COMException（0x80040154）：[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我在 C 项目中遇到异常 System Runtime InteropServices COMException 0x80040154 检
在类的所有方法之前运行一个方法

在 C 3 或 4 中可以做到这一点吗也许有一些反思 class Magic RunBeforeAll public void BaseMethod runs BaseMethod before being executed public
剪贴板在 .NET 3.5 和 4 中的行为有所不同，但为什么呢？

我们最近将一个非常大的项目从 NET Framework 3 5 升级到 4 最初一切似乎都工作正常但现在复制粘贴操作开始出现错误我已经成功制作了一个小型的可复制应用程序它显示了 NET 3 5 和 4 中的不同行为我还找到了一种解
转到定义：“无法导航到插入符号下的符号。”

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动我今天突然开始在我的项目中遇到一个问题单击转到定义会出现一个奇怪的错误无法导航到
双精度类型二维多维数组的 pinvoke 编组作为 c# 和 c++ 之间的输入和输出

我有以下我正在尝试解决的双物质类型的 2d 多维数组的 c 和 c pinvoke 编组我已经查看了以下热门内容以获得我目前拥有的内容使用双精度数组进行 P Invoke 在 C 和 C 之间编组数据 https stackoverflo
WinRT 定时注销

我正在开发一个 WinRT 应用程序要求之一是应用程序应具有定时注销功能这意味着在任何屏幕上如果应用程序空闲了 10 分钟应用程序应该注销并导航回主屏幕显然执行此操作的强力方法是在每个页面的每个网格上连接指针按下事件并在触
保存符号方程以供以后使用？

From here http www mathworks com help releases R2011a toolbox symbolic brvfu8o 1 html brvfxem 1 我正在尝试求解这样的符号方程组 syms x y

随机推荐

无法使用装饰器覆盖类对象的 str 结果

请参阅下面我的回答发布问题后我意识到发生了什么事我尝试使用装饰器覆盖类的字符串表示形式不起作用我一定错过了一些东西但不知道它是什么 from functools import wraps def str dec obj wraps
水晶报告 .net 4 的问题

我之前在 net 3 5 中使用过 Crystal Reports 但自从升级到 Net 4 0 后我遇到了以下错误错误 5 找不到类型或命名空间名称 CrystalDecisions 是否缺少 using 指令或程序集引用 C Use
Robocopy 命令行 - 带空格的文件

我正在尝试运行以下命令 robocopy exe eisdevl nas gatech edu coldfusion devl cfapps cfeis mybeap eisdevl nas gatech edu coldfusion te
在Java中，如何将十六进制字符串转换为byte[]？ [复制]

这个问题在这里已经有答案了我在 Java 中使用以下函数将加密字符串转换为十六进制格式 public static String toHex byte buf StringBuffer strbuf new StringBuffer bu
在 ggplot 和 stat_function() 中叠加对数正态密度

我尝试通过叠加一个函数stat function in ggplot但无法弄清楚我的错误这个例子产生了一个漂亮的图 data lt data frame x rt 10000 df 7 ggplot data data aes x x g
当窗口移动到屏幕左上角时如何禁用窗口最大化？

我有一个设置了ResizeMode CanResizeWithGrip 和AllowTransparency true 的窗口它工作正常直到它移动到屏幕顶部然后自动最大化如何阻止它最大化以便我可以将屏幕显示为位于屏幕顶部的窗口 T
如何在测试中手动模拟 Svg？

我在我的应用程序中使用存根文件来模拟图像这对我来说 99 的时间都有效但是我有一个组件可以根据输入渲染不同的图像因此我希望能够在单元测试中检查输入是否创建了正确的输出基本上我想做的是如果用户输入狮子我的组件将显示狮子的图片
使用外部 jar“不是托管类型”的 Spring 启动

我有一个正在拉入公共罐子的弹簧应用程序该 jar 包含带注释的 DTO 类运行 mvn clean build 命令成功运行并构建 jar 一旦我运行 java jar target MyApp 1 0 0 BUILD SNAPSHOT
将 mime 多部分主体部分写入输出流时出错

我有执行异步文件上传的代码该代码在我的开发虚拟机上运行良好但在将其部署到客户端系统后我不断收到此错误将 mime 多部分主体部分写入输出流时出错我知道这是抛出错误的行但我似乎无法弄清楚为什么 Read the form data
可用的viewcell按钮

我有 tableview 我在其中对 tableviewcell 进行了子类化单元格中有一个水平滚动视图我向滚动视图添加动态按钮我的要求 1 当我第一次点击 row0 上的按钮时我需要为点击的按钮设置不同的 BG 颜色并在数组中添
运行“app”时出错：Android studio 3.1 中出现未知错误

我已经将我的 android studio 更新到了新的稳定版3 1版构建项目后无法运行如果有人遇到同样的问题或找到任何解决方案请告诉我只需前往运行编辑配置并向下滚动到窗口底部在这里您会看到一个选项发射前首先删除小窗口
如何使用 GNU Parallel 编写多核排序

GNU 并行 http www gnu org software parallel GNU并行是一个shell工具用于使用一台或多台计算机并行执行作业例如如果我想编写一个多核版本wc我可以做 cat XXX parallel bloc
如何使用 awk 每 n 行插入一个空行？

我有一个像这样的输入文件 line 1 line 2 line 3 line 4 line 5 line 6 我想使用 awk 每隔几行插入一个空行例如每两个 line 1 line 2 line 3 line 4 line 5 lin
Mac 上的 Mercurial“未提供用户名”错误

我刚刚在 OSX Mountain Lion Max 10 8 上安装了 Mercurial 在第一次提交时出现错误 abort no username supplied see hg help config 我看到了很多答案这些答案表明
make找不到tools.jar

运行Ubuntu 12 04 我已经添加到路径 home jeffrey jdk1 6 0 43 lib 我正在尝试使用 Make 从源代码构建 make j16 但遇到错误 build core config mk 268 Error c
来自 pandas Dataframe 的具有不确定性的 LaTeX 表

我目前正在编写一份报告其中包含用 python 计算并存储在 pandas DataFrame 中的许多值和不确定性这些值必须放入报告中包括错误目前我唯一的方法是手动将值与错误合并其中一个示例如下所示 begin tabular
如何MVC 5下拉（多选）框

我在使用这个下拉框时遇到了问题似乎无法正确处理代码如下查看 Index cshtml using EvaSimulator Models Model EvaSimulator Models ModelVariables ViewBag
当有更多可用机器时，Spark 仅使用一台工作机器

我正在尝试通过 Spark 并行化机器学习预测任务我之前已经在其他任务中成功使用过 Spark 多次并且之前没有遇到过并行化问题在这个特定任务中我的集群有 4 个工作线程我在具有 4 个分区的 RDD 上调用 mapPartiti
使用 silverlight 的 Wcf 服务的最佳实践？

您将如何构建在 silverlight 应用程序中调用 wcf 服务的代码仅使用一次实例化的 wcf 服务代理又名单例并在整个 SL 应用程序中使用它如果是这样您如何解决 ws call completed 事件取消订阅控件的问题
计算卷积的最快方法

有人知道计算卷积最快的方法吗不幸的是我处理的矩阵非常大 500x500x200 如果我使用convn在 MATLAB 中这需要很长时间我必须在嵌套循环中迭代此计算所以我使用了 FFT 卷积现在速度更快了但是我仍在寻找更快的

计算卷积的最快方法

计算卷积的最快方法 的相关文章

随机推荐

热门标签

计算卷积的最快方法的相关文章