Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
OpenMP 为内联函数声明 SIMD
The 当前的 OpenMP 标准 http www openmp org mp documents openmp 4 5 pdf subsection 2 8 2说关于declare simdC C 指令 在函数上使用声明 simd 构造
c
openmp
在 openMP C++ 中并行化许多嵌套 for 循环
你好 我是 C 新手 我编写了一个可以运行的代码 但是由于许多嵌套的 for 循环 它很慢 我想通过 openmp 来加速它 任何可以指导我的人 我尝试使用 pragma omp 并行 前ip循环并在这个循环中我使用了 pragma omp
c
parallelprocessing
openmp
nestedloops
使用 -fopenmp 和 -lgomp 链接 OpenMP 之间的区别
最近几天我一直在努力解决一个奇怪的问题 我们使用 GCC 4 8 创建一些库 静态链接它们的一些依赖项 例如 log4cplus 或 boost 对于这些库 我们使用 boost python 创建了 Python 绑定 每次这样的库使用
c
openmp
staticlinking
dlopen
不确定 openmp 循环中应该共享或私有什么
我有一个更新矩阵 A 的循环 我想将其设为 openmp 但我不确定哪些变量应该共享和私有 我本以为只有 ii 和 jj 就可以工作 但事实并非如此 我想我也需要在某个地方进行 OMP ATOMIC UPDATE 该循环仅计算 N 和 N
loops
parallelprocessing
Fortran
openmp
Android OpenCV 并行化循环
我知道 OpenMP 包含在 NDK 中 使用示例如下 http recursify com blog 2013 08 09 openmp on android http recursify com blog 2013 08 09 open
Android
c
opencv
androidndk
openmp
Gcc 卸载编译选项
我正在尝试使用 Ubuntu 18 04 上的 gcc 10 CUDA 11 和此 CMakeLists txt 文件 或 OpenMP 版本 构建最简单的具有 GPU 卸载功能的 OpenMP 或 OpenACC C 程序 cmake m
gcc
CMake
openmp
OpenACC
offloading
OpenMP 并行区域中嵌套函数的内部编译器错误
我尝试调用GSL库的蒙特卡罗积分子程序来进行一些数值计算 因为我的 for 循环相当简单 这意味着不同运行的结果是独立的 所以我预计使用 OpenMP 进行并行化应该非常简单 然而 当我编译它时 它总是显示 内部编译器错误 分段错误 并且什
gcc
openmp
gsl
internalcompilererror
装修调度系统
我想使用多个处理器并行执行线性运算 将复杂的数学函数拟合到某些数据集 假设我的机器有 8 个核心 我想要容纳 1000 个数据集 我期望的是某个系统将 1000 个数据集作为队列 并将它们发送到 8 个核心进行处理 因此它首先将 1000
c
Multithreading
Queue
multiprocessing
openmp
OpenMP:不要使用超线程核心(一半“num_threads()”带有超线程)
In g 4 7 中的 OpenMP 并行 效率不高吗 5x CPU 时为 2 5x https stackoverflow com questions 36950532 is openmp parallel for in g 4 7 no
c
openmp
hyperthreading
cpucores
g47
是否可以将 OpenMP 库与 Android NDK 一起使用?
是否可以将 OpenMP 库与 Android NDK 一起使用 也许有人已经尝试将它们编译在一起并可以提供一些提示 随着双核平板电脑 智能手机的出现 我认为在应用程序开发中使用 OpenMP 功能会非常好 先感谢您 对于现在遇到这个问题的
Android
androidndk
openmp
gcc 自动矢量化(未处理的数据引用)
我不明白为什么这样的代码没有用 gcc 4 4 6 进行矢量化 int MyFunc const float pfTab float pfResult int iSize int iIndex for int i 0 i lt iSize
gcc
openmp
autovectorization
为什么 OpenMP SIMD 指令会降低性能?
我正在学习如何在 OpenMP Fortran 中使用 SIMD 指令 我 写了简单的代码 program loop implicit none integer i j real 8 x x 0 0 do i 1 10000 do j 1
Fortran
openmp
SIMD
#pragma 末尾的隐式屏障
朋友们 我正在尝试学习 openMP 范例 我使用以下代码来理解 omp for pragma int main void int tid int i omp set num threads 5 pragma omp parallel pr
parallelprocessing
openmp
OpenMPI
Fortran + OpenMP + 多态性:到底不支持什么?
我知道 OpenMP 4 5 标准表示 Fortran 中不支持 多态实体 这到底是什么意思 这是否仅排除对具有 PASS 属性的类型绑定过程的调用 但我仍然可以以其他方式使用具有类型绑定过程的用户定义类型的实例 例如访问其组件 此限制是否
Fortran
polymorphism
openmp
OpenMp 根据变量设置并行循环的线程数
有没有办法根据变量的值设置 OpenMP 并行区域的线程数 最初 整个应用程序的线程数 nofCores 在我的 AMD FX 8350 上 nofCores 8 对于这个区域 如果变量是 3 那么我只需要 3 个线程 如果变量 gt 核心
c
openmp
Qt 支持 OpenMP 吗?
我在 Visual Studio 项目中使用 OpenMP 目前非常认真地考虑更改为 QT Creator Visual Studio 不是很糟糕吗 我对微软的期望更高 但无论如何 QT Creator 支持 OpenMP 吗 如果出现这种
QT
openmp
嵌套循环、内循环并行化、重用线程
免责声明 以下示例只是一个快速理解问题的虚拟示例 如果您正在考虑现实世界的问题 请考虑任何动态编程 问题 我们有一个 n m 矩阵 我们想要复制前一行的元素 如以下代码所示 for i 1 i lt n i for j 0 j lt m j
c
Multithreading
gcc
Optimization
openmp
即使 num_threads(1) 时,openmp 的性能提升也难以理解
下面几行代码 int nrows 4096 int ncols 4096 size t numel nrows ncols unsigned char buff unsigned char malloc numel unsigned cha
c
openmp
c openmp并行用于并行区域内
我的问题是这样的one https stackoverflow com questions 11493265 for loop inside parallel region 但我想做一些不同的事情 例如 在我的并行区域内 我想在 4 个线程
c
Multithreading
forloop
openmp
为什么 Visual Studio 2019 不支持 Openmp 的 for-reduction 中的关键字“max”?
当我像这样使用 openmp 时 pragma omp parallel for reduction max dumax IDE 将在 Openmp 中引发错误 max reduction 无效 pragma omp parallel fo
c
openmp
VisualStudio2019
«
1
2
3
4
5
6
...12
»