没有 if-else 语句的一维卷积（非 FFT）？

2024-01-03

我编写了一个简单的串行一维卷积函数（如下）。我也在尝试 GPU 卷积实现。这主要是出于我自己的好奇心；我正在尝试了解各种非 FFT 实现策略之间的性能权衡。

避免分支对于我的 GPU 卷积实验非常重要，因为分支在 Nvidia GPU 上的成本很高。我的一个朋友提到，有一种方法可以实现下面的代码，而无需if/else声明，但他不记得它是如何运作的。

我怎样才能在不使用任何东西的情况下进行正确的一维卷积实现if/else声明？

这是我用 C++ 编写的基本一维串行代码：

vector<int> myConv1d(vector<int> vec, vector<int> kernel)
{
    int paddedLength = vec.size() + kernel.size() - 1;
    vector<int> convolved(paddedLength); //zeros
    reverse(kernel.begin(), kernel.end()); //flip the kernel (if we don't flip it, then we have correlation instead of convolution)
    for(int outputIdx=0; outputIdx<paddedLength; outputIdx++) //index into 'convolved' vector
    {
        int vecIdx = outputIdx - kernel.size() + 1; //aligns with leftmost element of kernel
        for(int kernelIdx=0; kernelIdx<kernel.size(); kernelIdx++)
        {
            if( (vecIdx+kernelIdx) >= 0  &&  (vecIdx+kernelIdx) < vec.size() ) //TODO: FIND A WAY TO REMOVE THIS
            {
                convolved[outputIdx] += kernel[kernelIdx]*vec[vecIdx+kernelIdx];
            }
        }
    }
    return convolved;
}

一些简短的说明：

我确实找到了some https://stackoverflow.com/questions/10145452/cuda-small-kernel-2d-convolution-how-to-do-it?rq=1 related https://stackoverflow.com/questions/3886836/optimizing-1d-convolution posts https://stackoverflow.com/questions/7237907/1d-fast-convolution-without-fft，但我不太明白避免条件语句的策略。
我还编写了一个 2D 卷积实现，我希望也将这篇文章的结果应用到 2D 版本。
这不是家庭作业。它与我们的一项研究项目关系不大，但主要是为了学习。

你为什么不做这样的事情呢？

int lowerBound = std::max( 0, -vecIdx );
int upperBound = std::min( kernel.size(), vec.size() - vecIdx );
for( int kernelIdx = lowerBound; kernelIdx < upperBound; kernelIdx++ )

抱歉，如果我不明白这个问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Optimization

imageprocessing

Convolution

没有 if-else 语句的一维卷积（非 FFT）？的相关文章

fopen_s 怎么会比 fopen 更安全呢？

我正在处理遗留代码Windows平台当我编译代码时VS2013 它给出以下警告错误 C4996 fopen 该函数或变量可能不安全考虑使用fopen s反而要禁用弃用请使用 CRT SECURE NO WARNINGS 详情请参见
使用 Json.NET 序列化子类

我正在尝试使用 Json NET 序列化子类生成的 json 包含超类的序列化属性但是not子类对象的属性这似乎与我发现的一个问题有关这里就这样 https stackoverflow com q 5863496 498969 但必须
生成多个随机数

我想生成 25 个唯一的随机数并将它们列在控制台中数字的长度应至少为 10 个字符有什么简单的方法可以做到这一点吗尝试将数字构建为字符串并使用 HashSet 确保它们是唯一的 Random random new Random Ha
ASP.NET Web 应用程序中的身份验证遇到问题

我正在尝试对从登录页面登录我的 Web 应用程序的用户进行身份验证我正在使用本教程 http support microsoft com kb 301240作为指南它几乎准确地解释了我希望做什么但是当我输入用户名和密码时验证不起作用
Dapper 在执行时挂起

我有一个 IDb连接 sql UPDATE 表名 SET json json lastupdate SYSDATE WHERE id id var param new DynamicParameters param Add json jso
嵌入资源文件的路径

我的资源文件中有一个图标我想引用它这是需要图标文件路径的代码 IWshRuntimeLibrary IWshShortcut MyShortcut MyShortcut IWshRuntimeLibrary IWshShortcut W
如何在C中同时运行两个子进程？

所以我开始学习并发编程但由于某种原因我什至无法掌握基础知识我有一个名为 fork c 的文件其中包含一个 main 方法在此方法中我将 main 分叉两次分别进入子进程 1 和 2 在孩子 1 中我打印了字符 A 50 次在
Visual Studio 中列表框的上移、下移按钮[重复]

这个问题在这里已经有答案了我正在尝试制作一个上移按钮和一个下移按钮以移动 Microsoft Visual Studio 2012 中列表框中的选定项目我已经在 WDF jquery winforms 和其他一些表单中看到了其他示例
控制台应用程序中使用 Unicode 字符的 _tprintf

我正在从 Unicode 构建的控制台应用程序使用 C 和 Visual Studio 2008 执行这个简单的输出此代码旨在在 Windows 上运行 tprintf L Some sample string n 一切正常但是如果我
如何将STL容器数据转储到gdb中？

我无法在 gdb 中转储 STL 无序映射容器值变量类型是 std unordered map var 我的 gdb 版本 7 7 1 GDB配置 configure host x86 64 linux gnu target x86 64
我在使用 ado.net 时收到错误 Argument 2 may not be pass with ref keywords

int t 0 cmd Parameters AddWithValue Res ref t 我在第二行收到错误参数 2 不能与 ref 关键字一起传递您只能通过引用传递参数ref if the 范围 is a ref参数也是如此 Add
如何从外语线程调用Python函数（C++）

我正在开发一个程序使用 DirectShow 来抓取音频数据媒体文件 DirectShow 使用线程将音频数据传递给回调我的程序中的函数然后我让该回调函数调用另一个函数 Python 中的函数我使用 Boost Python 来包
在 C# 中使用命名空间别名有什么好处？ [复制]

这个问题在这里已经有答案了使用命名空间别名有什么好处仅仅是为了简化编码吗仅当与类发生冲突时我才使用名称空间别名对我来说这根本没有简化我的意见是如果没有必要就不要使用
C#：自定义转换为值类型

是否可以将自定义类转换为值类型这是一个例子 var x new Foo var y int x Does not compile 是否有可能实现上述情况我需要超载一些东西吗Foo 您将必须重载强制转换运算符 public class F
Gremlin.net 文本包含等效项

我正在使用 Gremlin net 库连接到 janus 图形服务器我使用 cassandra 和弹性搜索进行数据存储和索引在我使用的 gremlin 语言和 gremlin 控制台中文本包含在属性的文本中进行搜索我正在使用混合索引
连接到没有元数据的网络服务

我想连接到此网络服务 https training api temando com schema 2009 06 server wsdl https training api temando com schema 2009 06 serve
C 变量声明的效率 [重复]

这个问题在这里已经有答案了例如在 C 中声明一个变量需要多长时间int x or unsigned long long var 我想知道它是否会让我的代码在类似的事情中更快 for conditions int var 0 code 这
卸载程序

我正在尝试使用此代码卸载程序但它似乎不起作用我尝试过其他答案但似乎也不起作用有人可以帮助我吗我正在尝试按给定名称 displayName 卸载该程序例如我给出 displayName Appname 那么此代码应该从我的计算机
Boost.asio和异步链，unique_ptr？

我对异步编程不太熟悉我有一个问题我的问题如下给出 boost asio 中 C 11 的 echo server 示例 http www boost org doc libs 1 60 0 doc html boost asio ex
如何使用 C# 为 azure devops 变量赋值

我有 selenium C 测试脚本可以从浏览器获取令牌我有两个 azure devops 任务一个用于执行 selenium 测试另一个用于执行 API 测试我想将 selenium 测试获取的令牌传递给 API 测试执行任务

随机推荐

禁用 Cypress 自动滚动

我正在测试我的应用程序我有很长的侧边菜单并且我有这样的代码 cy get tab click force true 自动滚动发生在获取和单击之间然后选定的选项卡不可见因为顶部菜单的位置已固定我找到了很多解决方案但没有一个有效到
如何在 Swift iOS 应用程序中添加 Google Drive API？

我有一个用 Swift 编写的应用程序它已经使用了 SwiftyDropbox API 我用 cocoapods 安装了 SwiftyDropbox use frameworks 关键词现在当我添加这个 pod 时 Google AP
在 WooCommerce 3+ 中向订单添加自定义字段

在 WooCommerce 中我想添加一个新的自定义字段来订单详细信息现在我可以使用下面的代码创建一个新的自定义字段 referenceNumber 并在其中添加 ordercreated 值 update post meta orde
SpriteKit场景切换时的内存问题

Ok so awhile back in testing I had a random crash with no error and I have no clue why So i went into analyze things and
npm 如何/为什么建议不要以 root 身份运行？

简而言之首先为什么npm http npmjs org 建议它只能以非 root 身份运行我非常不相信其他所有包管理器 apt yum gem pacman 要求 sudo 是错误的其次当我遵循他们的建议并运行npm insta
:this 在 Ruby on Rails 中意味着什么？

我是 Ruby 和 Ruby on Rails 世界的新手我已经阅读了一些指南但我在使用以下语法时遇到了一些问题我认为使用 conditionRuby 中使用语法来定义具有某种访问器的类属性例如 class Sample attr
将 Flutter 小部件定位到屏幕外

正如标题所提到的我试图将我的小部件放置在屏幕之外目前我已经设法将小部件图像偏移到屏幕之外但这不是我期望的结果屏幕外的图像在状态栏上仍然可见这就是它的样子这就是我期望的样子用 adobe XD 设计 Widget build B
Rails 3 的 A/B 框架？

有没有像 ABingo 或 Vanity 这样的东西可以在 Rails 3 中运行我知道有 Google 网站优化器和可视化网站优化器但我需要更多的功能来确定显示的内容以及跟踪的内容而这些功能超出了它们的能力如果没有我什至会考虑相
为什么简单的 Dockerfile 给出“权限被拒绝”？

我正在学习将 Docker 与 ROS 结合使用我对以下错误消息感到惊讶 FROM ros kinetic robot xenial create non root user ENV USERNAME ros RUN adduser in
如何在 Entity Framework Core 中调用带有多个表联接的存储过程？

我必须调用一个从多个表中选择记录的存储过程我已尝试以下代码但它为实体类以外的其他表中的列返回 null private async Task
子+父参考SQL

我正在尝试编写一个查询来显示项目的名称和父项目的名称但到目前为止还没有提供正确的方法 CREATE TABLE project p id NUMBER 6 project name VARCHAR2 30 client id NUMBER
如何使用div代替表格

我正在尝试创建以下表格布局但我想使用 DIV 而不是 TABLE CELL1 CELL2 CELL3 我希望所有单元格的高度由其内容设置即没有高度样式我尝试过在 cell1 上使用 float left 但似乎无法让单元格 2 和
Mac OS X Java 更新的源代码[重复]

这个问题在这里已经有答案了 Java for Mac OS X 10 6 Update 3 升级到 java 1 6 0 22 但是它们不包含源代码或 JavaDoc 有谁知道苹果是否提供了源代码如果是在哪里可以找到它我想将源代码附
增加值并将其设置为 onClick 事件的 var

我面临着一个非常奇怪的问题导致感觉就像无论你如何首先这是代码 renderImages gt let i 0 const arr https truffle assets imgix net pxqrocxwsjcc 6OcJeUMa
MySQL If Date 语句？

有没有办法通过 mysql 查询返回 true 或 false 我有一张桌子 id start 4 2012 03 01 00 00 00 8 2012 01 20 00 00 00 我也想回来TRUE如果当前日期大于开始日期并且FALSE
有没有办法允许用户提交 html 内容，同时仍然启用模型验证？

我需要允许用户在其文本输入中提交包含 html 的表单值这是一个面向内部的应用程序因此这样做相当安全我已经成功地使用了 ValidateInput false 有关方法的属性但这会抑制all对相关方法视图模型进行模型验证但我只想
如何像 jsfiddle.net 中那样调整多个相邻文本区域的大小？

如何像jsfiddle net网站那样通过在区域1 2和3上拖动鼠标来调整textarea的大小我的代码是 HTML div fieldset div class window top A div div class handler ho
正则表达式仅匹配字符串以目标结尾的情况

我需要一个正则表达式它仅与以我要查找的目标结尾的字符串匹配我需要找到具有特定扩展名的文件问题是该扩展名也出现在其他文件中例如我有两个文件名为 B82177 2014 07 08T141507758Z ccf and B82177 2
iPhone SDK WebRTC 集成错误

安装时WebRTC我的 iOS 项目出现以下错误 Undefined symbols for architecture i386 OBJC CLASS RTCICECandidate referenced from objc class r
没有 if-else 语句的一维卷积（非 FFT）？

我编写了一个简单的串行一维卷积函数如下我也在尝试 GPU 卷积实现这主要是出于我自己的好奇心我正在尝试了解各种非 FFT 实现策略之间的性能权衡避免分支对于我的 GPU 卷积实验非常重要因为分支在 Nvidia GPU 上的成本

没有 if-else 语句的一维卷积（非 FFT）？

没有 if-else 语句的一维卷积（非 FFT）？ 的相关文章

随机推荐

热门标签

没有 if-else 语句的一维卷积（非 FFT）？的相关文章