通过向量 OpenMP C 进行矩阵乘法 [重复]

2024-02-18

我正在尝试用 C (OpenMP) 通过向量乘法编写矩阵但是当我添加处理器时我的程序会变慢......

1 proc - 1,3 s
2 proc - 2,6 s
4 proc - 5,47 s

我在我的电脑（核心 i5）和我们学校的集群上测试了这个，结果是相同的（程序变慢）

这是我的代码（矩阵是 10000 x 10000），向量是 10000：

double start_time = clock();
#pragma omp parallel private(i) num_threads(4)
{
    tid = omp_get_thread_num();
    world_size = omp_get_num_threads();
    printf("Threads: %d\n",world_size);

    for(y = 0; y < matrix_size ; y++){
        #pragma omp parallel for private(i) shared(results, vector, matrix)
        for(i = 0; i < matrix_size; i++){
                results[y] = results[y] + vector[i]*matrix[i][y];   
        }
    }
}
double end_time = clock();
double result_time = (end_time - start_time) / CLOCKS_PER_SEC;
printf("Time: %f\n", result_time);

我的问题是：有什么错误吗？对我来说这似乎很简单并且应该加快速度

我基本上已经回答了这个问题使用 openmp 并行化矩阵乘以列和行向量 https://stackoverflow.com/questions/23277508/parallelizing-matrix-times-a-vector-by-columns-and-by-rows-with-openmp/23277953#23277953.

当您写入时，您会遇到竞争条件results[y]。要解决这个问题，并且仍然并行化内部循环，您必须制作私有版本results[y]，并行填充它们，然后将它们合并到关键部分。

在下面的代码中我假设您正在使用double，将其替换为float or int或您正在使用的任何数据类型（请注意，您的内部循环将遍历第一个索引matrix[i][y]这对缓存不友好）。

#pragma omp parallel num_threads(4)
{
    int y,i;
    double* results_private = (double*)calloc(matrix_size, sizeof(double));
    for(y = 0; y < matrix_size ; y++) {
        #pragma omp for
        for(i = 0; i < matrix_size; i++) {
            results_private[y] += vector[i]*matrix[i][y];   
        }
    }
    #pragma omp critical
    {
        for(y=0; y<matrix_size; y++) results[y] += results_private[y];
    }
    free(results_private);
}

如果这是家庭作业，并且您想真正给老师留下深刻印象，那么可以在没有关键部分的情况下进行合并。请参阅此链接以了解该怎么做在不使用批评家的情况下与 openmp 并行填充直方图数组缩减 https://stackoverflow.com/questions/16789242/fill-histograms-array-reduction-in-parallel-with-openmp-without-using-a-critic虽然我不能保证它会更快。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

openmp

通过向量 OpenMP C 进行矩阵乘法 [重复] 的相关文章

从 Makefile 中的 C++FLAGS 中删除一个标志？

我有一个 Makefile 其中包含另一个设置了很多默认值的 makefile 我无法编辑包含的 makefile 并且我想更改 makefile 中 C FLAGS 的值即使它是在包含的 makefile 中设置的具体来说每当 de
检查数据库中是否存在记录

我正在使用这些代码行来检查记录是否存在 SqlCommand check User Name new SqlCommand SELECT FROM Table WHERE user txtBox UserName Text conn int
为什么模板类的静态成员不唯一

看一下下面的代码 include
从 unsigned char* 到 char* 的转换无效

这是一个代码 1 int main int argc char argv 2 3 signed char S psc 4 unsigned char U pusc 5 char C pc 6 7 C S 8 C U 9 10 pc psc
如何在 Asp.Net Core 6 中向类型化 HttpClient 添加承载令牌身份验证

我正在尝试使用 ASP Net Core 6 设置一个 Web api 以便用户可以到达我的端点然后我使用特权帐户在幕后的 D365 中执行一些工作我正在使用类型化的 HTTP 客户端但我不确定如何插入承载身份验证以便来自该客户端的
如何将 mat 转换为 array2d？

我为dlib http dlib net face landmark detection ex cpp html那里的面部地标代码使用 array2d 来获取图像但我喜欢使用 Mat 读取图像并转换为 array2d 因为 dlib 仅支
如何进行Visual Studio格式字典初始化？

所有 Visual Studio 也包括 2012 不格式化以下内容 messageProcessor new Dictionary
C++ 中可以使用匿名类作为返回类型吗？

有没有办法在 C 中使用匿名类作为返回类型我用谷歌搜索这可能有效 struct Test fun 但是这段代码无法编译错误信息是新类型不能在返回类型中定义其实代码没有任何意义我只是想弄清楚匿名类是否可以用作C 中的返回类型这是我
C 中的双重否定：是否保证返回 0/1？

Is x 标准保证返回0 1 请注意我是not询问 C 其中定义了 bool 类型是的在 C99 中请参阅 6 5 3 3 4 逻辑非运算符的结果是0如果其操作数的值比较不等于0 1如果其操作数的值比较等于 0 结果具有类型in
我们什么时候应该在.NET中使用NativeMemory.Alloc()？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 NET6 C 引入NativeMemory类但我不知道什么时候应该使用NativeMemory Alloc 而不是普通的数组实例化
在关键服务器上对字符串进行内存受限的外部排序，并合并和计算重复项（数十亿个文件名）

我们的服务器生成如下文件 c521c143 2a23 42ef 89d1 557915e2323a sign xml在其日志文件夹中第一部分是GUID 第二部分是名称模板我想计算具有同名模板的文件的数量例如我们有 c521c143
公共基类打破了元组的空基类优化

gcc 4 7 1 对元组进行空基类优化我认为这是一个非常有用的功能然而这似乎有一个意想不到的限制 include
如何使用 Selenium Webdriver .NET 绑定设置 Chrome 首选项？

这是我正在使用的用户代理可以成功设置而下载首选项则不能 Windows 7 Chrome 26 Selenium dotnet 2 31 2 chromedriver win 26 0 1383 0 ChromeOptions chro
代码块 - 使用大地址感知标志进行编译

如何使用以下命令在 64 位系统上编译 32 位应用程序LARGE ADRESS AWARE使用代码块标记我需要使用超过 2GB 的内存应该是添加的情况 Wl large address aware到链接标志我不使用 CodeBloc
如何按名字和姓氏排序，然后按 SamAccountName 排序，其中并非所有姓名都有名字和姓氏？

目前我有以下内容来自 LDAP Get context based on currently logged on user PrincipalContext domainContext new PrincipalContext Cont
C# 从今天起 30 天

我需要我的应用程序从今天起 30 天后过期我会将当前日期存储在应用程序配置中如何检查应用程序是否已过期我不介意用户是否将时钟调回来并且应用程序可以正常工作用户太愚蠢而不会这样做 if appmode Trial string dat
提升shared_from_this<>()

有人可以用几句话概括一下如何提升shared from this lt gt 应该使用智能指针特别是从使用绑定函数在 io service 中注册处理程序的角度来看编辑一些回复要求提供更多背景信息基本上我正在寻找陷阱即人们使用
曲线/路径骨架二值图像处理

我正在尝试开发一个可以处理图像骨架的路径曲线的代码我想要一个来自两点之间骨架的点向量该代码在添加一些点后结束我没有找到解决方案 include opencv2 highgui highgui hpp include opencv2
如何编写完全可移植的 4 字节字符常量的编译时初始化

遗留代码大致如下所示 define MAKEID a b c d UInt32 a lt lt 24 UInt32 b lt lt 16 UInt32 c lt lt 8 UInt32 d define ID FORM MAKEID F
如何在c#中获取斐波那契数

伙计们我有一个关于斐波那契的问题如何获得斐波那契数列该数字也将以用户输入结束例如如果我输入 21 则输出必须为 0 1 1 2 3 5 8 13 21 这是我的代码 static void Main string args int

随机推荐

Primefaces上传，如何在高级模式下只允许一次上传

我想知道是否可以通过使用 primefaces 提前上传模式来限制用户仅上传一个文件目前我有
WPF：当 MVVM 绑定属性更改时激活触发器

不知怎的我在这里兜圈子如果这个问题的答案是显而易见的请原谅我我想对视图中 ViewModel 中更改的属性做出反应当属性 bool 更改时视图应该启动动画 BeginStoryBoard 实际上在我的应用程序中有 4 个这样
如何向 sql 视图添加主键？ - 或者将视图链接到 LINQ-2-Entities 的替代方法

我正在或尝试向我的实体对象模型添加一个非常简单的视图数据库位于 SQL Server 2008 中我使用 C 在 Net 3 5 SP1 上该视图有两个字段 color 和 colorcount 分别是 Varchar 50 和
jstree中如何回滚无法移动的节点

我试图弄清楚如何仅回滚未成功移动的文件夹节点下面的代码是我正在尝试做的事情的示例当您选择了几个文件夹并将它们移动到另一个文件夹中时就会出现问题如果其中一个目录无法移动我希望能够将其回滚到其原始父目录很遗憾 jstree roll
在捆绑 NSBundle 中找不到名为“MainStoryBoard”的故事板

几天前我开始了一个新的应用程序并开始使用模拟器来测试它我从一个空项目开始并手动添加故事板模拟器构建并运行我的应用程序一切正常但当我尝试构建到我的 iPhone 上时我收到消息在捆绑 NSBundle 中找不到名为 MainSto
Python 杀死线程

我正在尝试杀死 python 中的一个线程异常将是执行此操作的首选方法因为通过 try except 对优雅地退出线程的 run 方法将允许关闭资源我试过 Python 有没有办法杀死一个线程 https stackoverflow
Inline::Perl5 的列表返回给出项目的计数，而不是列表

一些简单的 Inline Perl5 代码返回一个列表但它似乎返回项目的计数而不是实际的列表更改涉及的项目数量会更改计数 use Inline Perl5 my p5 Inline Perl5 new my perl5 code q t
Mathematica：如何防止对 In[-1] 求值？

当我尝试在 Wolfram 中获取最后一个输入表达式时数学5 2 使用In 1 我得到评估输出 In 1 On In 2 2 In 1 Out 2 4 During evaluation of In 1 In trace In 1 gt I
使用 WebClient 以适当的扩展名保存图像

我需要从网站检索图像并将其保存到本地文件夹图像类型有 png jpg 和 gif 我尝试过使用 string url http redsox tcs auckland ac nz CSS CSService svc string save
无法在插件 org.springframework.boot:spring-boot-maven-plugin:1.1.4.RELEASE 中找到目标 '' 在可用目标重新打包中

我昨天在 eclipse 中运行了一个 spring 应用程序我有 Windows 7 我今天通过命令提示符运行了它使用以下命令 mvn spring boot run 这次没有成功我收到了消息 Could not find goal
如何区分 malloc 字符串和字符串文字？

有没有一种方法在纯C中来区分malloc从字符串文字中提取字符串而不知道哪个是哪个严格来说我试图找到一种方法来检查变量是否是 malloced 字符串如果是我将释放它如果没有我就放手当然我可以向后挖掘代码并确定变量是否
方法到底什么时候会产生副作用？

正如我一直理解的那样对程序状态的任何更改或与 IO 有关的任何事情都是副作用更改是发生在全局变量中还是发生在调用该方法的对象的私有字段中并不重要由此可见所有不返回任何内容的方法要么根本不执行任何操作要么有副作用我的困惑来自于
通过网页发送 Outlook 电子邮件

我有一个使用 ASP net 和 C 开发的 Web 应用程序该应用程序在我公司的 Intranet 上运行由于该应用程序的所有用户无一例外都使用 Microsoft Outlook 因此我希望该应用程序能够在客户端打开 Outlook
垃圾引用和悬空引用有什么区别？

垃圾引用和悬空引用有什么区别悬空引用是对不再存在的对象的引用垃圾是无法通过引用到达的对象垃圾收集语言中不存在悬空引用因为对象仅在不再可访问时才会被回收仅收集垃圾在某些语言或框架中您可以使用弱引用它可以悬空因为在收集过程中
如何允许 https 网站上的 iframe 内包含 http 内容

我将一些 HTML 加载到 iframe 中但是当引用的文件使用 http 而不是 https 时出现以下错误已阻止 current page name 处的页面运行来自 referenced filename 的不安全内容有什么方
JavaScript“未定义”与“void 0”

到底有什么区别undefined and void 0 哪个是首选为什么不同之处在于某些浏览器允许您覆盖undefined 然而 void anything总是返回真实值不明确的 function undefined undefine
如何将react-hook-form与ant design或material UI一起使用

我正在尝试使用react hook form库来验证表单当我使用 ant design 或 Material UI 渲染视图时它无法正常工作
html 中包含大量脚本标记是否会产生性能问题？

在 html 文件中包含大量例如 50 个脚本标记是否存在任何问题它是否会导致页面渲染时间出现任何性能问题我的页面上有一个部分用于提取地理位置点并将其放入数组中以在谷歌地图上使用我可以仅针对地理位置点创建一个单独的查询但我相信
扩展“通用”TypeScript 接口

考虑以下 TS 定义 type GenericPropsWithChildren
通过向量 OpenMP C 进行矩阵乘法 [重复]

这个问题在这里已经有答案了我正在尝试用 C OpenMP 通过向量乘法编写矩阵但是当我添加处理器时我的程序会变慢 1 proc 1 3 s 2 proc 2 6 s 4 proc 5 47 s 我在我的电脑核心 i5 和我们学校的集群

通过向量 OpenMP C 进行矩阵乘法 [重复]

通过向量 OpenMP C 进行矩阵乘法 [重复] 的相关文章

随机推荐

热门标签