Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用 OpenMP 时无用的 printf 没有加速
我刚刚编写了第一个 OpenMP 程序 它并行化了一个简单的 for 循环 我在双核机器上运行代码 发现从 1 个线程变为 2 个线程时速度有所提高 然而 我在学校 Linux 服务器上运行相同的代码并没有看到加速 在尝试了不同的事情之后
Multithreading
printf
parallelprocessing
openmp
performance
C++ OpenMP:嵌套循环,其中内部迭代器依赖于外部迭代器
考虑以下代码 include
c
parallelprocessing
openmp
并行迭代器
我正在设计一个 C 数据结构 用于图形 供并行代码 使用 OpenMP 使用 假设我想要一个能够迭代所有元素 节点 的方法 当然 这个迭代将是并行的 是否可以使用迭代器来实现此目的 迭代器应该是什么样子才能实现并行访问 在这种情况下 您会建
c
Iterator
Iteration
openmp
我可以将多个线程分配给 OpenMP 中的代码段吗?
我正在寻找一种方法来并行执行代码部分 每个部分使用多个线程 例如 如果我有 16 个线程和两个任务 我希望每个线程有 8 个线程同时执行这两个任务 OpenMP 有多种构造 section task 并行执行一般代码 但它们是单线程的 在我
c
Multithreading
openmp
基于任务的编程:#pragma omp task 与 #pragma omp parallel for
考虑到 void saxpy worksharing float x float y float a int N pragma omp parallel for for int i 0 i lt N i y i y i a x i And
task
openmp
Pthreads 与 OpenMP
我正在使用 Linux 用 C 创建一个多线程应用程序 我不确定是否应该使用 POSIX 线程 API 还是 OpenMP API 使用两者有何优缺点 Edit 有人可以澄清这两个 API 是否创建内核级 or 用户级线程 Pthreads
c
pthreads
openmp
使用 openmp 优化 N-queen
我正在学习 OPENMP 并编写以下代码来解决 n 皇后问题 Full Code https github com Shafaet Codes blob master OPENMP Parallel 20N Queen 20problem
parallelprocessing
openmp
OMP_NUM_THREADS=1 时 #pragma ompatomic 的性能问题
我观察到我正在编写的 openmp 代码出现了意外的 对我来说 行为 代码结构如下 pragma omp parallel for for int i 0 i
c
openmp
atomic
pragma
singlethreaded
测量 OpenMP Fork/Join 延迟
由于 MPI 3 具有共享内存并行功能 并且它似乎与我的应用程序完美匹配 因此我正在认真考虑将我的混合 OpemMP MPI 代码重写为纯 MPI 实现 为了给棺材里钉上最后一颗钉子 我决定运行一个小程序来测试 OpenMP fork jo
c
Multithreading
openmp
performancetesting
latency
在不平衡树上拆分 OpenMP 线程
我正在尝试使用 OpenMP 并行进行树操作 例如对树中所有叶子中的数字进行求和 我遇到的问题是我工作的树不平衡 子节点的数量不同 分支的大小也不同 我目前在这些树上使用递归函数 我想要实现的是 1 在第一个可能的机会时分割线程 假设它是一
c
Multithreading
openmp
为什么thread_local不能应用于非静态数据成员以及如何实现线程本地非静态数据成员?
Why may thread local不适用于非静态数据成员 接受的答案这个问题 https stackoverflow com questions 10999131 can you use thread local variables
c
Multithreading
C11
openmp
threadlocalstorage
OpenMP 因大型数组而崩溃
我正在使用 Fortran 和 OpenMP 但当我尝试在存在大型数组时使用 OpenMP 并行化循环时 我不断遇到问题 例如 以下代码 PROGRAM main IMPLICIT NONE INTEGER PARAMETER NUMLOO
Fortran
openmp
fortran90
gfortran
在 Mac OS 上使用 OpenMP 和 C++11
我正在尝试在我的 C 11 代码中使用一些 OpenMP 多线程功能 例如 pragma omp parallel for 当我尝试使用以下命令进行编译时 clang std c 11 stdlib libc fopenmp main cp
c
C11
openmp
macossierra
OpenMP 为内联函数声明 SIMD
The 当前的 OpenMP 标准 http www openmp org mp documents openmp 4 5 pdf subsection 2 8 2说关于declare simdC C 指令 在函数上使用声明 simd 构造
c
openmp
在 openMP C++ 中并行化许多嵌套 for 循环
你好 我是 C 新手 我编写了一个可以运行的代码 但是由于许多嵌套的 for 循环 它很慢 我想通过 openmp 来加速它 任何可以指导我的人 我尝试使用 pragma omp 并行 前ip循环并在这个循环中我使用了 pragma omp
c
parallelprocessing
openmp
nestedloops
使用 -fopenmp 和 -lgomp 链接 OpenMP 之间的区别
最近几天我一直在努力解决一个奇怪的问题 我们使用 GCC 4 8 创建一些库 静态链接它们的一些依赖项 例如 log4cplus 或 boost 对于这些库 我们使用 boost python 创建了 Python 绑定 每次这样的库使用
c
openmp
staticlinking
dlopen
不确定 openmp 循环中应该共享或私有什么
我有一个更新矩阵 A 的循环 我想将其设为 openmp 但我不确定哪些变量应该共享和私有 我本以为只有 ii 和 jj 就可以工作 但事实并非如此 我想我也需要在某个地方进行 OMP ATOMIC UPDATE 该循环仅计算 N 和 N
loops
parallelprocessing
Fortran
openmp
Android OpenCV 并行化循环
我知道 OpenMP 包含在 NDK 中 使用示例如下 http recursify com blog 2013 08 09 openmp on android http recursify com blog 2013 08 09 open
Android
c
opencv
androidndk
openmp
Gcc 卸载编译选项
我正在尝试使用 Ubuntu 18 04 上的 gcc 10 CUDA 11 和此 CMakeLists txt 文件 或 OpenMP 版本 构建最简单的具有 GPU 卸载功能的 OpenMP 或 OpenACC C 程序 cmake m
gcc
CMake
openmp
OpenACC
offloading
OpenMP 并行区域中嵌套函数的内部编译器错误
我尝试调用GSL库的蒙特卡罗积分子程序来进行一些数值计算 因为我的 for 循环相当简单 这意味着不同运行的结果是独立的 所以我预计使用 OpenMP 进行并行化应该非常简单 然而 当我编译它时 它总是显示 内部编译器错误 分段错误 并且什
gcc
openmp
gsl
internalcompilererror
1
2
3
4
5
6
...12
»