OpenACC 是否会影响正常的 GPU 渲染?

2024-02-18

我试图弄清楚是否可以使用 OpenACC 代替正常的 CPU 串行执行调用。通常我的编程都是关于 3D 编程,或者以某种方式正常使用 GPU。 IE。图像处理或其他需要使用着色器的渲染类型。我想弄清楚这个图书馆是否对我有利。

我问这个问题的原因是,如果我渲染 3D 图形(尽可能快),它会减慢该过程吗?或者它是否能够保持(理论上)“高帧速率”。

如果是这样,需要权衡什么,权衡多少?我不愿意牺牲 3D 图形(显示)性能来增强 CPU 上串行执行的操作。

编辑: 这是一个 C++ 上下文。


在我熟悉的 AMD 和 NVIDIA GPU 上,OpenACC 程序将利用着色器程序在某种程度上也会使用的计算资源。 GPU 中还有许多其他图形硬件在计算和图形之间不共享,但有一些共享资源。同样,GPU 可以通过 PCIE 连接到系统,因此这也可以提供共享资源或争用点(但是,这是罕见的计算或图形程序,甚至接近耗尽现代 Gen3 x16 PCIE 的带宽)联系。)

因此,如果您同时使用图形(或计算)着色器以及 OpenACC 加速,则在某种程度上会出现资源争用。争论的程度或权衡不是我可以概括的。这在很大程度上取决于程序的具体情况,以及计算函数和图形函数的范围和详细顺序。

GPU 设计人员考虑到了这些类型的用例,因此 GPU 通常非常擅长在可能争夺资源的各种任务之间进行快速上下文切换。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OpenACC 是否会影响正常的 GPU 渲染? 的相关文章

  • 为什么 Chrome 审核建议我最小化 Cookie 大小?

    如何最小化请求的 cookie 大小 Chrome 似乎 警告我 我的 cookie 大小为 41B 这根本不是很多 但是它警告我有什么原因吗 这是一个 PHPSESSID cookie 我真的不知道如何最小化它 有任何想法吗 我的请求响应
  • PrintStream是有缓冲的,但是flush不会降低性能,而BufferedOutputStream会加速性能

    我预计由于 PrintStream 是缓冲的 通过在每次 print 之后添加刷新操作 速度性能应该会显着降低 但事实并非如此 如下面的代码片段所示 此外 将 PrintStream 包裹在 BufferedOutputStream 周围可
  • 更改二维数组元素的值会更改整个列

    当我打印我的arrvalue 我得到了 2D 数组的正确值 但是当我退出 while 循环时 我的值都是错误的 我不确定我做错了什么 num runs n 4 x np linspace 1 1 n y np linspace 1 1 n
  • LINQ 函数的顺序重要吗?

    基本上 正如问题所述 LINQ 函数的顺序是否重要 表现 显然 结果仍然必须相同 Example myCollection OrderBy item gt item CreatedDate Where item gt item Code g
  • 为什么 std::atomic 比 volatile bool 慢很多?

    多年来我一直使用 volatile bool 来控制线程执行 并且效果很好 in my class declaration volatile bool stop In the thread function while stop do th
  • php字符串是值类型吗?

    为什么php的string是值类型 每次将参数传递给函数时 每次进行赋值时 每次连接都会导致字符串被复制时 它都会被复制到各处 我的 NET 经验告诉我 它似乎效率低下 迫使我几乎在任何地方都使用引用 考虑以下替代方案 替代方案1 This
  • 为什么 Haskell 的默认字符串实现是一个字符链接列表?

    Haskell 默认值的事实String众所周知 实现在速度和内存方面都效率不高 据我所知 lists一般来说 在 Haskell 中实现为单链表 并且适用于大多数小型 简单数据类型 例如Int 这似乎不是一个好主意 但是对于String这
  • 将嵌套循环计算转换为 Numpy 以加速

    我的Python程序的一部分包含以下代码段 其中一个新的网格 是根据旧网格中找到的数据计算的 网格是二维浮点数列表 该代码使用了三个 for 循环 for t in xrange 0 t step for h in xrange 1 hei
  • 未使用的功能会产生什么后果

    我想知道在代码中使用未使用的函数会产生什么 如果有什么后果 如果您查找并删除所有未使用的函数和变量 性能是否会有明显的改进 或者删除未使用的函数和变量只是一个好习惯 未使用的功能不会损害性能 他们让维护代码的人的工作变得更加困难 现代 ID
  • 获取总体 CPU 百分比使用率的可能性有哪些

    我有以下问题 在UWP中 我们如何获取总体CPU使用率 RAM使用率 可用RAM 正在运行的进程等 UWP 中的任务管理器需要它 您好 经过一番查看后 您似乎无法获得设备 CPU RAM 和可用 RAM 或正在运行的进程 您可以获得 CPU
  • setInterval() 如何影响性能?

    我们正在使用 Twitter Bootstrap 作为框架构建一个 Web 应用程序 但在显示 隐藏工具提示时遇到问题 除了尝试找到实际问题的解决方案之外 我还有一个关于我们同时使用的解决方法的问题 从性能角度来看 使用 setInterv
  • 字符串与 StringBuilder

    我理解之间的区别String and StringBuilder StringBuilder是可变的 但是两者之间有很大的性能差异吗 我正在开发的程序有很多大小写驱动的字符串附加 500 正在使用StringBuilder更好的选择 是的
  • Xcode“使用性能工具运行”被禁用?

    我正在尝试从我的 Xcode 项目中查找内存泄漏 我不知道发生了什么 我无法选择任何内容Run gt Run with performance tool 事物列表被禁用 请帮助我 我是初学者 问题是我已经删除了构建文件夹并尝试使用性能工具运
  • R:使用带有 .Call 和 C/C++ 包装器的 Fortran 子例程而不是 .Fortran 的优点?

    我有一个 R 包 它使用大量 Fortran 子例程来进行递归线性代数计算的嵌套循环 很大程度上依赖于 BLAS 和 LAPACK 例程 作为 Fortran 的接口 我使用 Fortran功能 我刚刚读过乔纳森卡拉汉的博客文章 http
  • 有效地生成所有排列

    我需要尽快生成所有排列 https en wikipedia org wiki Permutation整数的0 1 2 n 1并得到结果作为NumPy https numpy org 形状数组 factorial n n 或者迭代此类数组的
  • 为什么 pandas 在简单的数学运算上比 numpy 更快?

    最近 我观察到 pandas 的乘法速度更快 我在下面的例子中向您展示了这一点 如此简单的操作怎么可能做到这一点 这怎么可能呢 pandas 数据帧中的底层数据容器是 numpy 数组 测量 我使用形状为 10k 10k 的数组 数据框 i
  • 通过增加索引之和来生成排序组合的有效方法

    对于启发式算法 我需要一个接一个地评估特定集合的组合 直到达到停止标准 由于它们很多 目前我正在使用以下内存高效迭代器块生成它们 受到 python 的启发 itertools combinations http docs python o
  • 就 size_t 而言,“目标平台上最大可能对象的大小”是多少

    我正在阅读有关的文章size t在 C C 中http web archive org web 20081006073410 http www embedded com columns programmingpointers 2009001
  • jQuery - 提高处理 XML 时的选择器性能

    我正在处理一个 XML 文件 当使用 XPath 样式选择器选择节点时 该文件的性能非常慢 这是运行特别慢的部分代码 for i 0 i
  • PhoneGap 1.4 封装 Sencha Touch 2.X - 性能怎么样?

    我正在构建一个多平台平板电脑应用程序 仅使用其 Webview 使用 Phonegap 1 4 对其进行包装 然后使用 Sencha Touch 2 框架发挥我的魔力 我所说的多平台是指 iOS 5 X 和 Android 3 0 目前 到

随机推荐

  • HOG:对比度归一化步骤做了什么?

    根据HOG流程 如论文中所述用于人体检测的定向梯度直方图 参见下面的链接 对比归一化步骤是在分箱和加权投票之后完成的 我不明白 如果我已经计算了细胞的加权梯度 那么图像对比度的归一化现在对我有什么帮助 据我了解 对比度归一化是在原始图像上完
  • ggplot (geom_segment) 中的颜色

    使用facet grid时 如何根据数据中的因素对geom segments进行着色 我的方法失败了 因为颜色分配错误 这是一些数据 visual data data frame Values 10 1 Words c yeah what
  • 当我将 URL 添加到列表,然后使用 ajax 时,我尝试在某些 iframe 中显示列表的内容,页面会自行重新加载

    我正在构建一个仪表板 它的小工具是一些指向我想要在 iframe 内显示的不同页面的链接 我有一个按钮可以将新小工具添加到仪表板 添加新小工具后 我刷新仪表板 对于前 3 个小工具 应用程序没有任何问题 并且运行完美 但是 当我想添加第四个
  • 使用 bq 命令行实用程序运行保存的查询

    我有一个 BQ 脚本存储为 已保存的查询 我想知道是否可以使用 bq 命令行实用程序执行它 在文档中找不到相关内容 保存的查询 只能通过控制台访问 不能通过 API 访问 一种可能更适合您的方法是使用脚本和存储过程 https cloud
  • Git 中的致命错误:合并文件的多个阶段条目

    我正在从事我公司的一个生产项目 之前我创建了一个藏匿处并进行了一些更改 然后 当我尝试应用我的藏品时 它产生了冲突 我尝试通过单击每个文件中的 撤消 来重置 Visula Studio 中的所有更改 然后 当我尝试从 git bash 显示
  • 使用 @RequestBody List 的 Spring MVC REST 在语法上返回 HTTP 400

    我正在使用 Spring 4 Jackson 2 并在自定义类上使用 RequestBody 编写了一个功能齐全的 POST 方法 此方法在解组对象时没有任何问题 ResponseBody RequestMapping value stor
  • NSURLConnection、NSURLSession 和 AFNetworking 之间有什么区别? [关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我想知道它们之间的基本区别是什么 以及在 Objective c 和 swift 中管理 iOS 端 Web 服务的最佳和常见方法是什么 正
  • 如何在 Matlab 中将 PARFOR 与 Core i3 并行 4 工作

    我有适用于 Ubuntu 64 位的 Matlab R2012b 我有一个 Intel Core i3 CPU M 330 2 13GHz 4 我想用parfor同时并行化 4 个循环 因为 Intel Core i3 有 2 个核心和 4
  • Groovy SwingBuilder:更改面板颜色的按钮

    为什么这段代码会失败 我想更改动态构造的一系列多个面板中的一个面板的颜色 面板总数事先未知 由于某种原因 此代码在引用特定面板的名称 例如 panel2 时有效 但在我动态引用它 panelID 时则无效 import groovy swi
  • 如何从视频文件中获取图像

    你好 我是韩国的开发者 我有一些问题 所以我进入这个网站 InputStream is URL url new URL http 112 216 25 58 8888 VOD LAUNCHER media youtube sample3 m
  • 在 SQL 中使用 EXISTS 作为列

    是否可以使用的值EXISTS作为查询的一部分 请注意 不幸的是 由于客户端限制 我需要 SQLServer 2005 兼容的答案 因此 当返回一组结果时 其中一列是一个布尔值 它表明子查询是否会返回任何行 例如 我想返回用户名列表以及不同的
  • 如何使用 boost::asio 将 URL 转换为 IP 地址?

    所以我需要某种转向方式Protocol URLorIP Port串入串ip int port如何使用 boost ASIO 和 Boost Regex 来做这样的事情 或者是否有可能 使用获取 IPC 网络库 http cpp netlib
  • 在部分之间重新排列项目时 UICollectionView 崩溃

    我在动画中的各部分之间进行更改时遇到问题UICollectionView 我的程序总是崩溃 这是怎么回事 我有一个集合视图 它有四个部分 0 A 1 B 2 C 3 D 我想将其转换为只有三个具有相同项目的部分 0 A1 乙 丙2 D 我想
  • 如何取消拦截器中的当前请求 - Angular 4

    如你所知 可以使用拦截器在新版本的 Angular 4 中 在我的例子中 我想在某些情况下取消拦截器中的请求 那么有可能吗 也许我应该问的是 我应该采取哪种方式 如果我找到一种方法来重写对请求的一些响应而不是取消它 那也可以 我认为要切断拦
  • 无法编辑 crontab (linux Alpine)

    我在非 root 帐户下的 alpine 中遇到了 crontab 问题 bash 4 3 crontab e crontab must be suid to work properly 这是输出id命令 bash 4 3 id uid 4
  • 正则表达式:将所有内容匹配到最后一个空格而不包含它

    我想将字符串中的所有内容匹配到最后一个空格 但不包含它 举例来说 我想匹配我输入的字符bold RENATA T GROCHAL 到目前为止我已经 s https regex101 com r gM3aM2 1但是 它与最后一个空格匹配 但
  • 将具有多种数据类型的Python序列转换为张量

    我正在使用 TensorFlow r1 7 和 python3 6 5 我对 TensorFlow 也很陌生 所以如果可能的话 我希望有易于阅读的解释 我正在尝试使用此函数将输入数据转换为张量数据集tf data Dataset from
  • Pandas无法加载数据,csv编码之谜

    我正在尝试将数据集加载到 pandas 中 但似乎无法完成第 1 步 我是新手 所以如果这是显而易见的 请原谅 我已经搜索了以前的主题 但没有找到答案 数据大部分是汉字 这可能是问题所在 csv 非常大 可以在此处找到 http weibs
  • Cassandra 如何水平扩展?

    我看过一个video https www youtube com watch v B HTdrTgGNsCassandra 数据库非常有效 并且确实解释了很多有关 Cassandra 的内容 我还准备了一些关于 Cassandra 的文章和
  • OpenACC 是否会影响正常的 GPU 渲染?

    我试图弄清楚是否可以使用 OpenACC 代替正常的 CPU 串行执行调用 通常我的编程都是关于 3D 编程 或者以某种方式正常使用 GPU IE 图像处理或其他需要使用着色器的渲染类型 我想弄清楚这个图书馆是否对我有利 我问这个问题的原因