使用 CUDA 进行行列式计算 [关闭]

2024-01-08

是否有任何库或免费可用的代码可以计算a的行列式small (6x6),双精度矩阵完全在 GPU 上?


这是计划,您将需要缓冲 100 个这些微小矩阵并启动一次内核以立即计算所有这些矩阵的行列式。

我不会编写实际的代码,但这应该会有所帮助。

1) 启动 # 个块 = # 个矩阵。每个块计算每个矩阵的行列式。

2) det(A) = det(A11 * A22 - A21 * A12);其中 A 是 6x6,A11、A12、A21、A22 是 A 的 3x3 子矩阵。

3)写一个device对 3x3 矩阵进行矩阵乘法的函数

4) 3x3 矩阵的 det 计算起来很简单:使用这里的公式 https://reference.wolfram.com/language/ref/Det.html.

EDIT:显然(2)仅在 A21 * A12 == A12 * A21 时才有效

另一种选择如下

1) 通过高斯消元法进行 LU 分解 http://www.personal.psu.edu/jhm/f90/lectures/lu.html对于每个 6x6 矩阵

2)将U的对角线元素相乘得到行列式。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 CUDA 进行行列式计算 [关闭] 的相关文章

  • Golang调用CUDA库

    我正在尝试从 Go 代码中调用 CUDA 函数 我有以下三个文件 test h int test add void test cu global void add int a int b int c c a b int test add v
  • 鉴于 GPU 有任务队列并且是异步的,计算 FPS 的正确方法是什么?

    我始终认为计算 FPS 的正确方法是简单地计算绘制循环迭代所需的时间 互联网上的大部分内容似乎都是一致的 But 现代显卡被视为异步服务器 因此绘制循环会发出 GPU 上已有的顶点 纹理 等数据的绘制指令 这些调用不会阻塞调用线程 直到 G
  • Cuda Bayer/CFA 去马赛克示例

    我编写了一个 CUDA4 Bayer 去马赛克例程 但它比在 16 核 GTS250 上运行的单线程 CPU 代码慢 块大小是 16 16 图像暗淡是 16 的倍数 但更改此值并不会改善它 我做了什么明显愚蠢的事情吗 calling rou
  • Tensorflow:如何在模型训练过程中实时监控 GPU 性能?

    我是 Ubuntu 和 GPU 新手 最近在我们的实验室中使用了一台配备 Ubuntu 16 04 和 4 个 NVIDIA 1080ti GPU 的新 PC 该机还拥有i7 16核处理器 我有一些基本问题 为 GPU 安装 Tensorf
  • 如何将CUDA时钟周期转换为毫秒?

    我想用一些代码来测量时间within我的内核需要 我已经关注了这个问题 https stackoverflow com questions 11209228 timing different sections in cuda kernel连
  • 寻找 CUDA 中的最大值

    我正在尝试在 CUDA 中编写代码来查找最大值 对于给定的一组数字 假设您有 20 个数字 并且内核在 2 个块 每块 5 个线程 上运行 现在假设 10 个线程同时比较前 10 个值 并且thread 2找到最大值 因此线程 2 正在更新
  • 在 cuda 的 nvcc 编译器中使用 C++20

    我正在尝试使用std countr zero 函数从
  • 同时使用 2 个 GPU 调用 cudaMalloc 时性能较差

    我有一个应用程序 可以在用户系统上的 GPU 之间分配处理负载 基本上 每个 GPU 都有一个 CPU 线程来启动一个GPU处理间隔当由主应用程序线程定期触发时 考虑以下图像 使用 NVIDIA 的 CUDA 分析器工具生成 作为示例GPU
  • 多个进程可以共享一个 CUDA 上下文吗?

    这个问题是 Jason R 的后续问题comment https stackoverflow com questions 29964392 multiple cuda contexts for one device any sense co
  • Visual Studio - 过滤掉 nvcc 警告

    我正在编写 CUDA 程序 但收到令人讨厌的警告 Warning Cannot tell what pointer points to assuming global memory space 这是来自 nvcc 我无法禁用它 有没有办法过
  • 是否可以在GPU中实现Huffman解码?

    我们有一个用霍夫曼编码编码的数据库 这里的目的是将其及其关联的解码器复制到 GPU 上 然后在 GPU 上对数据库进行解码 并在解码后的数据库上执行操作 而无需将其复制回 CPU 上 我还远远不是霍夫曼专家 但我所知道的少数人表明 它似乎是
  • 如何确定完整的 CUDA 版本 + 颠覆版本?

    Linux 上的 CUDA 发行版曾经有一个名为version txt例如 CUDA Version 10 2 89 这非常有用 但是 从 CUDA 11 1 开始 该文件不再存在 我如何在 Linux 上通过命令行确定并检查 path t
  • DirectX 世界视图矩阵乘法 - GPU 或 CPU 的地方

    我是 directx 的新手 但令我惊讶的是 我看到的大多数示例中 世界矩阵和视图矩阵都是作为顶点着色器的一部分相乘 而不是与 CPU 相乘并将结果传递给着色器 对于刚性对象 这意味着您为对象的每个顶点将相同的两个矩阵相乘一次 我知道 GP
  • 设置最大 CUDA 资源

    我想知道是否可以设置 CUDA 应用程序的最大 GPU 资源 例如 如果我有一个 4GB GPU 但希望给定的应用程序只能访问 2GB 如果它尝试分配更多 就会失败 理想情况下 这可以在进程级别或 CUDA 上下文级别上设置 不 目前没有允
  • NvCplGetThermalSettings 返回 false

    问题 您好 我正在尝试使用 Delphi 获取 nividia gtx 980 的 GPU 温度 我看过C 问题 他的解决方案是不使用nvcpl dll 我认为这不是正确的解决方案 因为 nivida 有完整的文档说明如何处理 API 见下
  • CUDA 常量内存是否应该被均匀地访问?

    我的 CUDA 应用程序的恒定内存小于 8KB 既然它都会被缓存 我是否需要担心每个线程访问相同的地址以进行优化 如果是 如何确保所有线程同时访问同一地址 既然它都会被缓存 我是否需要担心每个线程访问相同的地址以进行优化 是的 这缓存本身每
  • 在 __device/global__ CUDA 内核中动态分配内存

    根据CUDA 编程指南 http developer download nvidia com compute cuda 3 2 prod toolkit docs CUDA C Programming Guide pdf 第 122 页 可
  • PHP 矩阵的逆矩阵

    I saw 这个问题 https stackoverflow com questions 211160 python inverse of a matrix 并弹出这个想法 PHP 有没有一种有效的方法来做到这一点 EDIT 最好有演示 你
  • Tensorflow:docker 镜像和 -gpu 后缀

    在具有 GPU 支持的 Tensorflow 的 Docker 映像中 例如 tensorflow tensorflow 2 2 0 gpu 安装的python包是tensorflow gpu 如图所示pip freeze 安装任何依赖于的
  • 有没有一种有效的方法来优化我的序列化代码?

    这个问题缺乏细节 因此 我决定创建另一个问题而不是编辑这个问题 新问题在这里 我可以并行化我的代码吗 还是不值得 https stackoverflow com questions 17937438 can i parallelize my

随机推荐

  • Jasmine angularjs - 监视控制器初始化时调用的方法

    我目前正在使用 Jasmine 与 Karma Testaulous 和 Web Storm 来编写单元测试 我在监视控制器初始化时立即调用的方法时遇到问题 是否可以监视控制器初始化时调用的方法 我的控制器代码 我试图监视的方法是getSe
  • 按下按钮后如何提示用户授予推送通知权限?

    I read 如何控制何时在 iOS 中提示用户推送通知权限 https stackoverflow com questions 30817069 how to control when to prompt user for push no
  • STL 容器 - 矢量、列表和双端队列之间的区别

    如果我想将元素也推入容器的开头 我应该使用双端队列而不是向量吗 我什么时候应该使用列表以及它的意义是什么 Use deque如果您需要在序列的开头和结尾以及随机访问时进行高效的插入 删除 使用list如果您需要在任何地方进行高效插入 而牺牲
  • 如何通过puppeteer获取嵌入页面的pdf?

    我正在尝试获取一个页面的 pdf 副本 其结构如下 我尝试用page pdf但我得到了一个空白的pdf 中间写着 无法加载插件 对于其他偶然发现这个问题的人来说
  • 如何更改 IPython %pdb 和 %debug 调试器?

    默认情况下 ipython 使用 ipdb 作为带有 pdb 或 debug 魔法的调试器 但是 我更喜欢 pdb 有没有办法更改用这些魔法调用的调试器 我知道我可以简单地在 pdb 的异常情况下使用 pdb xpm 但我想让它与 ipyt
  • 如何在Rstudio中运行python脚本

    我对如何从 Rstudio 运行 python 脚本有疑问 我最初的想法是从 GitHub 存储库获取 python 脚本 然后在 R 中运行它 我通过使用获取了 python 代码script lt getURL URL ssl veri
  • android - 启动屏幕上的进度条

    我的应用程序在加载时显示启动屏幕 我想在启动屏幕上的图标下方放置一个动画进度条 我尝试使用 XML 但它崩溃了 说无效标签进度条 这是我在 styles xml 中调用启动屏幕的代码 这是我的background splash xml 文件
  • Elixir:更新地图列表中的特定值

    给出以下地图列表 ball prop list id gt cue is idle gt true velocity x gt 0 0 velocity z gt 0 0 x gt 15 0 z gt 0 0 id gt ball 1 is
  • 匹配括号之间的整数

    我得到了一堆以下格式的字符串 ASDF 6 ZXC 1 OtPasd 4 asdffa 7 我需要检索有效字符串的括号之间的整数 只要满足以下条件 字符串就有效 括号之间仅存在空格 即 ZXCV a2 无效 所有支架均已正确关闭 即 qwr
  • AppleScript 中窗口关闭后退出应用程序

    我在 Xcode 中创建了一个 AppleScript 应用程序 我想知道如何让应用程序在窗口关闭后退出 Add a applicationShouldTerminateAfterLastWindowClosed http develope
  • Python:如何使用 dataframe.to_csv 保留前导零[重复]

    这个问题在这里已经有答案了 从txt文件读取数据后 有一个数据框 df1 如下所示 name l1 l2 a 00000 00000 b 00010 00002 c 00000 01218 当我使用Python代码时 如下所示 datafr
  • SQL Server 2008 - 在插入/更新触发器上将值复制到另一个表?

    我有这两个表 Tasks 和TasksHistory 从名称中您可以猜到我想创建Tasks 中发生的所有事情的历史记录 因此 插入或更新的每个新行都需要进入历史表 只需忽略它被删除的时间 以确保该行在历史记录中安全 我的想法是历史是精确复制
  • Automapper - 为什么使用 Mapper.Initialize?

    我通常不会在这里问这类问题 但不幸的是自动映射器 http automapper org 似乎是一个很好的映射库 但它的文档非常糟糕 该库的方法没有 XML 文档 我能找到的最官方的在线文档是this https github com Au
  • R 中按因子着色图

    我正在制作两个变量的散点图 并希望通过因子变量对点进行着色 这是一些可重现的代码 data lt iris plot data Sepal Length data Sepal Width col data Species 这一切都很好 但我
  • 为什么我们不能从java中的RequestBody中获取文件数据?

    我正在尝试将文件上传到服务器 因此我尝试使用 RequestBody 来获取文件的数据 但在尝试上传文件时收到 415 错误代码 所以我用谷歌搜索 找到了上传文件的解决方案 并知道我无法从请求正文中获取文件数据 所以我想知道为什么我们不能从
  • 使用 OpenLaszlo 的经验? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 In a 相关问题 https stackoverflow com questions 112351 recommendations for s
  • 需要帮助阻止 MSXML 添加命名空间

    我正在使用 MSXML 4 生成以下 xml 字符串
  • Asp.net mvc 授权属性与参数集成

    我想用一个 Authorize 属性在操作上的方式如下 Authorize Roles Administrator or UserId id public ActionResult Edit int id 现在我正在使用这样的逻辑 publ
  • 使用 R 的过程 GLM (SAS)

    我需要测试应该在奶牛遗传评估模型中包含哪些效应 在 SAS 中我会使用 proc GLM SAS 代码为 data paula1 set paula0 proc glm class year herd season model milk y
  • 使用 CUDA 进行行列式计算 [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 是否有任何库或免费可用的代码可以计算a的行列式small 6x6 双精度矩阵完全在 GPU 上 这是计