cuda中有模板化的数学函数吗？ [复制]

2024-05-03

我一直在寻找 cuda 中的模板化数学函数，但似乎找不到。在普通的 C++ 中，如果我调用std::sqrt它是模板化的，并且将根据参数是浮点数还是双精度数执行不同的版本。

我想要这样的 CUDA 设备代码。我的内核将真实类型作为模板参数传递，现在我必须在使用之间进行选择sqrtf用于浮动和sqrt对于双。我认为推力可能有这个功能，但它只适用于复数。

[将评论、删除的答案和一些附加历史记录转换为答案，以将其从 CUDA 标签的未答复队列中删除，请根据需要进行编辑和修改]

太长了；是的

最初的基于 Open64 的工具链在 2008-2009 年间添加了不错的模板支持（使得 Komrade 和后来的 Thrust 之类的东西成为可能），而现代前端实际上是 C++ 的一个适当的子集。由于模板支持和主机 C++ 编译自 CUDA 2 开发周期的某个时间起就已融入到工具链中，因此支持代码和数学库已在完全基于模板的重载系统中发展。

因此，CUDA 中的标准数学函数会根据参数类型进行重载，因此您可以编写sqrt(float)计算单精度平方根，或sqrt(double)计算双精度平方根。

这在 CUDA 文档中有记录here https://docs.nvidia.com/cuda/cuda-math-api/group__CUDA__MATH.html#group__CUDA__MATH.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

CUDA

cuda中有模板化的数学函数吗？ [复制] 的相关文章

为什么在连接两个字符串时 Python 比 C 更快？

目前我想比较 Python 和 C 用来处理字符串的速度我认为 C 应该比 Python 提供更好的性能然而我得到了完全相反的结果这是 C 程序 include
CLR 2.0 与 4.0 性能比较？

如果在 CLR 4 0 下运行为 CLR 2 0 编译的 NET 程序会运行得更快吗应用程序配置
代码 GetAsyncKeyState(VK_SHIFT) & 0x8000 中的这些数字是什么？它们是必不可少的吗？

我试图在按下按键的简单动作中找到这些数字及其含义的任何逻辑解释 GetAsyncKeyState VK SHIFT 0x8000 可以使用哪些其他值来代替0x8000它们与按键有什么关系 GetAsyncKeyState 根据文档返回如果
以编程方式读取 SQL Server 查询计划建议的 SQL 特定执行的索引？

如果我在 SSMS 中运行此命令 set showplan xml on GO exec some procedure arg1 arg2 arg3 GO set showplan xml off GO 我获得查询执行中涉及的完整调用堆栈的
GetType() 在 Type 实例上返回什么？

我在一些调试过程中遇到了这段代码 private bool HasBaseType Type type out Type baseType Type originalType type GetType baseType GetBaseTyp
JNI 将 Char* 2D 数组传递给 JAVA 代码

我想从 C 代码通过 JNI 层传递以下指针数组 char result MAXTEST MAXRESPONSE 12 12 8 3 29 70 5 2 42 42 在java代码中我写了以下声明 public static native
从同一个类中的另一个构造函数调用构造函数

我有一个带有两个构造函数的类 C 这是代码片段 public class FooBar public FooBar string s constructor 1 some functionality public FooBar int i
Visual Studio 在构建后显示假错误

我使用的是 Visual Studio 2017 构建后 sln在调试模式下我收到错误但是当我通过双击错误列表选项卡中的错误来访问错误时错误会从页面中消失并且错误数量也会减少我不太确定这种行为以及为什么会发生这种情况有超过 2
对 std::vector 进行排序但忽略某个数字

我有一个std vector
Python 属性和 Swig

我正在尝试使用 swig 为一些 C 代码创建 python 绑定我似乎遇到了一个问题试图从我拥有的一些访问器函数创建 python 属性方法如下 class Player public void entity Entity enti
类型约束

我有以下类层次结构 class Header IEnumerable
启动时的 Excel 加载项

我正在使用 Visual C 创建 Microsoft Excel 的加载项当我第一次创建解决方案时它包含一个名为 ThisAddIn Startup 的函数我在这个函数中添加了以下代码 private void ThisAddIn
如何在 Qt 应用程序中通过终端命令运行分离的应用程序？

我想使用命令 cd opencv opencv 3 0 0 alpha samples cpp cpp example facedetect lena jpg 在 Qt 应用程序中按钮的 clicked 方法上运行 OpenCV 示例代码
为什么从字典中获取时会得到 Action<> 的克隆？

我有以下字典 private Dictionary
在mysql连接字符串中添加应用程序名称/程序名称[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在寻找一种解决方案在连接字符串中添加应用程序名称或程序名称以便它在 MySQL Workbench 中的客户端连接下可见 SQL
高效列出目录中的所有子目录

请参阅迄今为止所采取的建议的编辑我正在尝试使用 WinAPI 和 C 列出给定目录中的所有目录文件夹现在我的算法又慢又低效使用 FindFirstFileEx 打开我正在搜索的文件夹然后我查看目录中的每个文件使用 FindNex
在屏幕上获取字符

我浏览了 NCurses 函数列表似乎找不到返回已打印在屏幕上的字符的函数每个字符单元格中存储的字符是否有可访问的值如果没有的话Windows终端有类似的功能吗我想用它来替换屏幕上某个值的所有字符例如所有a s 具有不同的特征
打印大型 WPF 用户控件

我有一个巨大的数据我想使用 WPF 打印我发现WPF提供了一个PrintDialog PrintVisual用于打印派生的任何 WPF 控件的方法Visual class PrintVisual只会打印一页因此我需要缩放控件以适合页面
Unity：通过拦截将两个接口注册为一个单例

我有一个实现两个接口的类我想对该类的方法应用拦截我正在遵循中的建议Unity 将两个接口注册为一个单例 https stackoverflow com questions 1394650 unity register two inter
实体框架中的“it”是什么

如果以前有人问过这个问题请原谅我但我的任何搜索中都没有出现它我有两个数据库表 Person 和 Employee 对每个类型的表进行建模例如 Employee is a Person 在我的 edmx 设计器中我定义了一个实体

随机推荐

以管理员身份从 cmd 批处理运行 PowerShell 脚本

我有一个 PowerShell 设置我想在执行策略可能受到限制并且需要管理员权限的计算机上执行理想情况下我可以将其包装在 cmd 批处理中如下所示 powershell Command Start Process powershel
使用 BIC 准则运行逐步线性模型

是否可以设置逐步线性模型来使用 BIC 标准而不是 AIC 我一直在尝试这个但它仍然使用 AIC 值而不是 BIC 来计算每个步骤 null lm data 1 1 full lm data 1 age bmi gender group
枚举和枚举类之间的区别[重复]

这个问题在这里已经有答案了谁能解释一下两者之间的区别 enum Type1 type2 And enum class Type1 type2 我经常使用前者可能太频繁而没有足够的封装但我从未使用过第二个例子 Thanks enum A
基于嵌入属性验证 Mongoid 中的嵌入文档

我有一个订阅者类它有 embeds many 订阅订阅具有属性状态我想添加对状态的验证以便每个订阅者只有一个订阅可以具有活动状态订户可以拥有多个状态为已购买或已过期的订阅这应该可以做到 class Subscribe
独立于符号的字符串的模式匹配

我需要一种算法可以在数据中找到预定义的模式以字符串的形式存在独立于数据和模式的实际符号字符我只关心符号之间的关系而不关心符号本身数据中的同一符号具有不同的模式符号也是合法的模式匹配算法必须强制执行的唯一一件事是保留模式中同一
不允许为 VPC 创建 EC2 实例

是否可以将 EC2 实例模板的 VPCId 定义为属性我想做的是 Resources Ec2Instance Type AWS EC2 Instance Properties SecurityGroups Ref AWSSecurityG
使用 pythons strftime 显示日期，例如“5 月 5 日”？ [复制]

这个问题在这里已经有答案了可能的重复 Python 日期顺序输出 https stackoverflow com questions 739241 python date ordinal output 在Python中 time strf
在 Perl 中，如何从父进程向子进程发送消息（或信号），反之亦然？

我正在编写一个管理多进程的程序这就是我所做的而且效果很好但现在我想将消息从子进程发送到父进程反之亦然从父进程到子进程你知道最好的方法吗你知道我所做的是否是我想要的正确方法从子进程到父进程发送消息信号或共享内存反之亦然
使用“nuxt build”时动态创建的类不可用 - tailwindcss nuxtjs

我有一个 nuxtjs 项目与 tailwindcss 一起使用在该项目中我动态生成负边距的类如下所示 div class mins 1 div 整个项目在本地运行良好但如果我运行nuxt build nuxt start 它的编
有没有办法重新分区 Kafka 流中的输入主题？

我有一个由 byte 键控的主题我想对其进行重新分区并通过消息正文中字段中的另一个键处理该主题我发现有KGroupedStream and groupby功能但它需要一个聚合函数来转换为 KTable KStream 我不需要聚合我
即使我确实为变量设置了初始值，数据段也没有被初始化

我已经编写了一个代码该代码应该生成某种数字列表但是即使我为它们分配了初始值我的数据段变量也没有被初始化 This is how DS 0000 looks when I run it 这是我的代码但数据段只保留垃圾值 MODEL s
实体框架的状态模式

我有一个模型Enquiry 它可以处于两种状态之一还有更多状态但出于此目的我将仅比较两种状态 New and Closed 查询所处的状态取决于用户能够对查询执行什么操作例如无法删除已关闭的查询而可以删除新的查询等等基本示例
Windows Phone 8.1 应用程序多语言

我正在使用 Visual Studio 2015 在 SilverLight 中创建 Windows Phone 应用程序 8 1 我正在用英语和阿拉伯语创建多语言应用程序为此我在项目中创建了 Strings 文件夹其中包含 en U
仅从 MySQL 中的日期时间 (YYYY-MM-DD HH:MM:SS) 中选择不同的日期

执行此命令会带来以下结果所有列中的所有日期因此它本质上与 SELECT date 执行相同的操作没有不同 SELECT DISTINCT date FROM daily ORDER BY date DESC 2013 02 12 16
如何在 Android Studio 中为单独的模块生成签名的 APK？

我的项目有 3 个模块 include app include videograbber include audiograbber 现在我想为Videograbber模块生成签名的APK 当我在 Android Studio 中使用生成签
自定义 UIAlertView？

鉴于蓝色与我的 UI 界面不相配我只是想知道是否有办法更改 uialertview 的颜色或者使用图像代替所有按钮关闭等仍然存在 Thanks CodeCropper 的优秀人员刚刚推出了一个开源控件可让您创建自定义警报视图这
Big O 用于有限、固定大小的可能值集

这个问题 https stackoverflow com questions 12305028 java what is the best way to find first duplicate character in a string引
在画布中的鼠标位置放大/缩小

我正在尝试使用 p5 js 实现缩放功能当前缩放级别以及 x 和 y 位置存储在controls view目的默认位置或 0 0 位置位于左上角问题是调整放大缩小时的 x 和 y 位置值以便无论视图的当前位置是什么它都会停留在缩
调试 python Web 服务

我正在使用找到的说明here http www diveintopython net http web services user agent html 尝试检查发送到我的网络服务器的 HTTP 命令但是我没有看到按照教程中的建议在控制
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真

cuda中有模板化的数学函数吗？ [复制]

cuda中有模板化的数学函数吗？ [复制] 的相关文章

随机推荐

热门标签