Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
最多不能超过 50%。矩阵乘法的理论性能
Problem 我正在学习 HPC 和代码优化 我尝试复制 Goto 的开创性矩阵乘法论文中的结果 http www cs utexas edu users pingali CS378 2008sp papers gotoPaper pdf
c
Optimization
matrix
openmp
SSE
具有子例程和函数的 Fortran OpenMP
免责声明 我很确定这个问题已经在某个地方得到了回答 但我自己和另一个人一直在努力搜索 但没有结果 我有一个看起来像这样的代码 PROGRAM main omp parallel do omp private somestuff shared
Fortran
threadsafety
openmp
OpenMP 并行减少会产生错误的结果
我正在使用信号矩阵 我的目标是计算一行所有元素的总和 该矩阵由以下结构表示 typedef struct matrix float data int rows int cols int leading dim matrix 我不得不提到矩阵
c
parallelprocessing
openmp
reduction
用于大型密集矩阵乘法的循环平铺/分块
我想知道是否有人可以向我展示如何有效地使用循环平铺 循环阻塞进行大型密集矩阵乘法 我在做C AB具有 1000x1000 矩阵 我按照维基百科上的循环平铺示例进行操作 但使用平铺得到的结果比不使用平铺的结果更差 http en wikipe
c
performance
openmp
SSE
matrixmultiplication
了解 OpenMP 有关 fork 的缺点
我想了解它们在这里的意思 为什么这个程序会 挂起 From https bisqwit iki fi story howto openmp https bisqwit iki fi story howto openmp OpenMP 和fo
c
openmp
4 个核心的 8 个逻辑线程并行运行速度最多可以提高 4 倍?
我正在对软件进行基准测试 该软件在 Intel 2670QM 上的执行速度比使用全部 8 个 逻辑 线程的串行版本快 4 倍 我想要一些社区反馈我对基准测试结果的看法s 当我在 4 个核心上使用 4 个线程时 速度提高了 4 倍 整个算法是
Multithreading
openmp
multicore
hyperthreading
OMP:OMP PARALLEL DO 和 OMP DO 之间有什么区别(根本没有并行指令)
好的 我希望以前没有问过这个问题 因为在搜索中找到这个问题有点棘手 我查阅了F95手册 但仍然觉得含糊不清 For the simple case of DO i 0 99
parallelprocessing
Fortran
openmp
OpenMP 如何重用线程
我认为线程的创建和删除可能代价高昂 OpenMP 是否尝试重用现有线程 例如 pragma omp parallel sections num threads 4 pragma omp section worker A pragma omp
c
Multithreading
parallelprocessing
openmp
OpenMp 与 IOS/Android 的兼容性
我正在尝试做什么 我正在研究C c 为所有平台构建产品的代码 我操作系统 Android Windows 移动 桌面 Mac Linux 到目前为止我做了什么 是的 有许多在线链接讨论 OpenMp 与不同处理器和操作系统的兼容性 但很难从
Android
ios
iphone
openmp
OpenMP 和 C++11 多线程
我目前正在从事一个混合高性能计算 HPC 和交互性的项目 因此 HPC 部分依赖于 OpenMP 主要是具有大量相同计算的 for 循环 但它包含在具有 GUI 和多线程的更大框架中 目前通过 c 11 线程实现 std thread an
c
Multithreading
C11
openmp
HPC
使用一个线程执行一个部分,并使用多个线程执行一个 for 循环
我正在使用 OpenMP 并且想要生成线程 以便一个线程执行一段代码并完成 与运行并行 for 循环迭代的 N 个线程并行 执行应该是这样的 Section A one thread Section B parallel for multi
c
parallelprocessing
openmp
OMP 线程私有对象未被破坏
底线 如何确保 threadprivate 实例被正确销毁 背景 接听时这个问题 https stackoverflow com questions 32347008 confused about firstprivate and thre
c
openmp
ICC
我可以安全地将 OpenMP 与 C++11 结合使用吗?
OpenMP 标准仅考虑 C 98 ISO IEC 14882 1998 这意味着在 C 03 甚至 C 11 下没有支持使用 OpenMP 的标准 因此 任何使用 C gt 98 和 OpenMP 的程序都会在标准之外运行 这意味着即使它
c
C11
openmp
如何正确生成/恢复 OpenMP 未绑定任务?
我编写了一个小型 C 程序来评估 OpenMP 在任务出现空闲时间 例如等待通信数据 时让出另一个任务的能力 include
task
openmp
创建数组时使用 OpenMP 时出现分段错误
我在访问 for 循环内的数组时遇到分段错误 我想做的是生成 DNA 字符串的所有子序列 当我在 for 中创建数组时 就发生了这种情况 读了一段时间后 我发现openmp限制了堆栈大小 所以使用堆来代替会更安全 所以我更改代码以使用mal
Arrays
c
Multithreading
parallelprocessing
openmp
在 OpenMP 中计算矩阵的条目
我对 openMP 很陌生 但我正在尝试编写一个简单的程序来并行生成矩阵的条目 即对于 N M 矩阵 A 令 A i j i j 下面包含一个最小的示例 include
c
openmp
为什么 OpenMP 版本较慢?
我正在尝试使用 OpenMP 我编写了一些代码来检查其性能 在具有 Kubuntu 11 04 的 4 核单 Intel CPU 上 使用 OpenMP 编译的以下程序比不使用 OpenMP 编译的程序慢约 20 倍 为什么 我通过 g g
c
openmp
为什么 OpenMP 缩减子句对于静态调度循环是不确定的?
我一直在从事一个多 GPU 项目 在该项目中我在获得非确定性结果方面遇到了问题 当我发现由于 CPU 上执行的归约子句而获得非确定性结果时 我感到很惊讶 在书里使用 OpenMP 下一步据说 线程组合其值来构建的顺序 共享结果的价值是不确定
Multithreading
parallelprocessing
openmp
对“omp_get_max_threads_”的未定义引用
我在尝试编译项目时遇到以下错误 fortran 使用 gfortran 对 omp get max threads 的未定义引用 对 omp get thread num 的未定义引用 问题是 我的 GCC 版本是 4 4 3 它应该支持
gcc
openmp
gfortran
隐式私有控制循环变量
我有疑问 并且在 OpenMP 文档中没有找到正确的答案 如果我有这样的循环 int i pragma omp parallel for for i 0 i lt 10 i do some stuff 是变量i隐式私有 我说得对吗 或者我必
c
Multithreading
parallelprocessing
openmp
«
1
2
3
4
5
6
7
...12
»