MPI_Type_create_subarray 和 MPI_Gather

2024-04-14

我必须解决一些 mpi 问题。我有 4 个从进程，每个进程都想发送一个 2d 子数组 (CHUNK_ROWS X CHUNK_COLUMNS) 到 master 0。Master 0 收集 ddd[ROWS][COLUMNS] 中的所有块并打印它。我想使用 MPI_Gather()

#include <mpi.h>
#include <iostream>
using namespace std;

#define ROWS 10
#define COLUMNS 10
#define CHUNK_ROWS 5
#define CHUNK_COLUMNS 5
#define TAG 0

int** alloca_matrice(int righe, int colonne)
{
int** matrice=NULL;
int i;

matrice = (int **)malloc(righe * sizeof(int*));

if(matrice != NULL){
  matrice[0] = (int *)malloc(righe*colonne*sizeof(int));
  if(matrice[0]!=NULL)
    for(i=1; i<righe; i++)
        matrice[i] = matrice[0]+i*colonne;
  else{
    free(matrice);
    matrice = NULL;
  }
}
else{
  matrice = NULL;
}
return matrice;

}

int main(int argc, char* argv[])
{

int my_id, numprocs,length,i,j;
int ndims, sizes[2],subsizes[2],starts[2];
int** DEBUG_CH=NULL;
int** ddd=NULL;
char name[BUFSIZ];
MPI_Datatype subarray=NULL;
//MPI_Status status;
MPI_Init(&argc, &argv) ;    
MPI_Comm_rank(MPI_COMM_WORLD, &my_id) ;
MPI_Comm_size(MPI_COMM_WORLD, &numprocs) ;  // Ottiene quanti processi sono attivi
MPI_Get_processor_name(name, &length);    

if(my_id!=0){
  //creo una sottomatrice ripulita dalle ghost cells
  ndims=2;
  sizes[0] = CHUNK_ROWS+2;
  sizes[1] = CHUNK_COLUMNS+2;
  subsizes[0] = CHUNK_ROWS;
  subsizes[1] = CHUNK_COLUMNS;
  starts[0] = 1;
  starts[1] = 1;
  MPI_Type_create_subarray(ndims,sizes,subsizes,starts,MPI_ORDER_C,MPI_INT,&subarray);
  MPI_Type_commit(&subarray);

  DEBUG_CH = alloca_matrice(CHUNK_ROWS+2,CHUNK_COLUMNS+2);
  for(i=0; i<CHUNK_ROWS+2; i++){
    for(j=0; j<CHUNK_COLUMNS+2; j++){
        if(i==0 || i==CHUNK_ROWS+1 || j==0 || j==CHUNK_COLUMNS+1)
            DEBUG_CH[i][j] = 5;
        else
            DEBUG_CH[i][j] = 1;
    }
  }
//MPI_Send(DEBUG_CH[0],1,subarray,0,TAG,MPI_COMM_WORLD);
}
if(my_id==0){
 ddd = alloca_matrice(ROWS,COLUMNS);
}

MPI_Gather(DEBUG_CH[0],1,subarray,ddd[0],CHUNK_ROWS*CHUNK_COLUMNS,MPI_INT,0,MPI_COMM_WORLD);
if(!my_id){
  for(i=0; i<ROWS; i++){
    for(j=0; j<COLUMNS; j++){
        printf("%d ",ddd[i][j]);
    }
    printf("\n");
  }
}

if(my_id)
 MPI_Type_free(&subarray);

MPI_Finalize();                             // Chiusura di MPI.
return 0;
}

谢谢大家。

所以这有点微妙，需要对 Gather 集合如何放置复杂类型有一定的了解。

如果你看最多MPI_Gather 的示例 http://www.netlib.org/utk/papers/mpi-book/node99.html，它们是一维数组，并且很容易解释应该发生什么；例如，您从每个进程获得 10 个整数，并且 Gather 足够聪明，可以将排名 0 的 10 个整数放在数组的开头，将排名 1 的 10 个整数放在数组的位置 10-19 处，依此类推。

不过，像这样的更复杂的布局要复杂一些。首先，从发送方的角度来看的数据布局与从接收方的角度来看的数据布局不同。从发送者的角度来看，您从数组元素开始[1][2], go to [1][5]（在大小为 7x7 的数组中），然后跳转到数组元素[2][3]-[2][5]， ETC。有 CHUNK_ROWS 数据块，每个数据块由 2 个整数分隔。

现在考虑接收者如何接收它们。假设它正在接收 0 级的数据。它将把它接收到数组元素中[0][0]-[0][4]- 到目前为止，一切都很好;但随后它将接收下一个数据块[1][0]-[1][4]，位于大小为 10x10 的数组中。这相当于跳过了 5 个元素。内存中的布局不同。因此接收器必须接收到不同的Subarray输入然后发送者发送，因为内存布局不同。

因此，虽然您可能会从如下所示的内容发送：

  sizes[0] = CHUNK_ROWS+2;
  sizes[1] = CHUNK_COLUMNS+2;
  subsizes[0] = CHUNK_ROWS;
  subsizes[1] = CHUNK_COLUMNS;
  starts[0] = 1;
  starts[1] = 1;
  MPI_Type_create_subarray(ndims,sizes,subsizes,starts,MPI_ORDER_C,MPI_INT,&sendsubarray);
  MPI_Type_commit(&sendsubarray);

你会收到类似这样的信息：

  sizes[0]    = ROWS;
  sizes[1]    = COLUMNS;
  subsizes[0] = CHUNK_ROWS;
  subsizes[1] = CHUNK_COLUMNS;
  starts[0]   = 0; starts[1] = 0;
  MPI_Type_create_subarray(ndims,sizes,subsizes,starts,MPI_ORDER_C,MPI_INT,&recvsubarray);
  MPI_Type_commit(&recvsubarray);

至关重要的是，请注意sizes array.

现在我们已经更接近了。请注意您的 MPI_Gather 行更改为如下所示：

MPI_Gather(DEBUG_CH[0],1,sendsubarray,recvptr,1,recvsubarray,0,MPI_COMM_WORLD);

以前的版本有一些功能不起作用，MPI_Gather(DEBUG_CH[0],1,subarray,ddd[0],CHUNK_ROWS*CHUNK_COLUMNS,MPI_INT,0,MPI_COMM_WORLD);-- 首先，请注意您正在引用ddd[0]，但对于除 0 级之外的每个等级，ddd=NULL，所以这将会失败。因此创建一个名为 say 的新变量recvptr，并且在等级零中，将其设置为ddd[0]。（其他进程认为它在哪里并不重要，因为它们没有接收到。）另外，我认为你不想接收CHUNK_ROWS*CHUNK_COLUMS MPI_INTs，因为这会将它们连续地放置在内存中，我的理解是您希望它们以与工作任务相同的方式布置，但在更大的数组中。

好的，现在我们已经取得进展了，但是上面的内容still由于一个有趣的原因，不起作用。对于一维数组示例，很容易找出第 n 列数据的去向。其计算方法是通过查找extent正在接收的数据，并在该数据之后开始下一个元素。但这在这里行不通。 “就在”零级数据结束之后不是第一级数据应该开始的位置（[0][5]）但反而，[4][5]-- 0 级子数组中最后一个元素之后的元素。在这里，您从不同等级接收到的数据是重叠的！因此，我们将不得不摆弄数据类型的范围，并手动指定每个排名的数据开始的位置。第二个是简单的部分；你使用MPI_Gatherv http://www.mcs.anl.gov/research/projects/mpi/www/www3/MPI_Gatherv.html当您需要手动指定每个处理器的数据量或数据的去向时，可以使用此函数。首先是比较棘手的部分。

MPI 让您指定给定数据类型的下限和上限 - 给定一块内存，该类型的第一位数据将存放在哪里，以及它“结束”的位置，这里仅意味着下一个数据的位置可以开始了。（数据可以超出类型的上限，我认为这会使这些名称产生误导，但这就是事情的方式。）您可以将其指定为您喜欢的任何内容，这对您来说很方便；因为我们将处理 a 中的元素int数组，让我们将类型的范围设置为 1 MPI_INT 大小。

  MPI_Type_create_resized(recvsubarray, 0, 1*sizeof(int), &resizedrevsubarray);
  MPI_Type_commit(&resizedrecvsubarray);

（请注意，我们只需对接收类型执行此操作；对于发送类型，因为我们只发送其中之一，所以这并不重要）。

现在，我们将使用 Gatherv 来指定每个元素的开始位置——以这个新调整大小的类型的“大小”为单位，它只是 1 个整数。所以如果我们想要一些东西进入大数组[0][5]，距大数组起始位置的位移为5；如果我们想让它进入位置[5][5]，位移为55。

最后，请注意，聚集和分散集体都假设即使是“主”或协调程序进程也在参与。如果协调器也有自己的全局数组部分，那么最容易实现此功能。

因此，以下内容对我有用：

#include <mpi.h>
#include <iostream>
#include <cstdlib>
using namespace std;

#define ROWS 10
#define COLUMNS 10
#define CHUNK_ROWS 5
#define CHUNK_COLUMNS 5
#define TAG 0

int** alloca_matrice(int righe, int colonne)
{
    int** matrice=NULL;
    int i;

    matrice = (int **)malloc(righe * sizeof(int*));

    if(matrice != NULL){
        matrice[0] = (int *)malloc(righe*colonne*sizeof(int));
        if(matrice[0]!=NULL)
            for(i=1; i<righe; i++)
                matrice[i] = matrice[0]+i*colonne;
        else{
            free(matrice);
            matrice = NULL;
        }
    }
    else{
        matrice = NULL;
    }
    return matrice;

}

int main(int argc, char* argv[])
{

    int my_id, numprocs,length,i,j;
    int ndims, sizes[2],subsizes[2],starts[2];
    int** DEBUG_CH=NULL;
    int** ddd=NULL;
    int *recvptr=NULL;
    char name[BUFSIZ];
    MPI_Datatype sendsubarray;
    MPI_Datatype recvsubarray;
    MPI_Datatype resizedrecvsubarray;
    //MPI_Status status;
    MPI_Init(&argc, &argv) ;    
    MPI_Comm_rank(MPI_COMM_WORLD, &my_id) ;
    MPI_Comm_size(MPI_COMM_WORLD, &numprocs) ;  // Ottiene quanti processi sono attivi
    if (numprocs != 4) {
        MPI_Abort(MPI_COMM_WORLD,1);
    }
    MPI_Get_processor_name(name, &length);    

    //creo una sottomatrice ripulita dalle ghost cells
    ndims=2;
    sizes[0] = CHUNK_ROWS+2;
    sizes[1] = CHUNK_COLUMNS+2;
    subsizes[0] = CHUNK_ROWS;
    subsizes[1] = CHUNK_COLUMNS;
    starts[0] = 1;
    starts[1] = 1;
    MPI_Type_create_subarray(ndims,sizes,subsizes,starts,MPI_ORDER_C,MPI_INT,&sendsubarray);
    MPI_Type_commit(&sendsubarray);

    DEBUG_CH = alloca_matrice(CHUNK_ROWS+2,CHUNK_COLUMNS+2);
    for(i=0; i<CHUNK_ROWS+2; i++){
        for(j=0; j<CHUNK_COLUMNS+2; j++){
            if(i==0 || i==CHUNK_ROWS+1 || j==0 || j==CHUNK_COLUMNS+1)
                DEBUG_CH[i][j] = 5;
            else
                DEBUG_CH[i][j] = my_id;
        }
    }

    recvptr=DEBUG_CH[0];
    if(my_id==0){
        ddd = alloca_matrice(ROWS,COLUMNS);
        sizes[0]    = ROWS; sizes[1] = COLUMNS;
        subsizes[0] = CHUNK_ROWS; subsizes[1] = CHUNK_COLUMNS;
        starts[0]   = 0; starts[1] = 0;
        MPI_Type_create_subarray(2,sizes,subsizes,starts,MPI_ORDER_C,MPI_INT,&recvsubarray);
        MPI_Type_commit(&recvsubarray);
        MPI_Type_create_resized(recvsubarray, 0, 1*sizeof(int), &resizedrecvsubarray);
        MPI_Type_commit(&resizedrecvsubarray);
        recvptr = ddd[0];
    }

    int counts[5]={1,1,1,1};
    int disps[5] ={0,5,50,55};
    MPI_Gatherv(DEBUG_CH[0],1,sendsubarray,recvptr,counts,disps,resizedrecvsubarray,0,MPI_COMM_WORLD);
    if(!my_id){
        for(i=0; i<ROWS; i++){
            for(j=0; j<COLUMNS; j++){
                printf("%d ",ddd[i][j]);
            }
            printf("\n");
        }
    }

    if(my_id == 0) {
        MPI_Type_free(&resizedrecvsubarray);
        MPI_Type_free(&recvsubarray);
        free(ddd[0]);
        free(ddd);
    } else {
        MPI_Type_free(&sendsubarray);
        free(DEBUG_CH[0]);
        free(DEBUG_CH);
    }

    MPI_Finalize();                             // Chiusura di MPI.
    return 0;
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MPI_Type_create_subarray 和 MPI_Gather 的相关文章

即使我没有#include ，为什么仍然可以使用 std::max 和 std::min ？

include
如何使用 Qtimer 添加 1 秒延迟

我目前有一个方法如下 void SomeMethod int a Delay for one sec timer gt start 1000 After one sec SomeOtherFunction a 这个方法实际上是一个附加到信号
如何在联系我们页面中使用用户电子邮件发送电子邮件？

我正在创建一个联系我们页面并且我想从该页面接收邮件因为它的邮件来自用户邮件我写了这段代码 var client new SmtpClient smtp gmail com 587 Credentials new NetworkCred
无法使用 ASP.NET Core 从 JWT 令牌获取声明

我正在尝试使用 ASP NET Core 实现 JWT 持有者身份验证的非常简单的实现我从控制器返回的响应有点像这样 var identity new ClaimsIdentity identity AddClaim new Claim
从空白启动时 VSTO 功能区不显示解决方案

如果我从文件新建项目菜单创建一个新的 Excel 2013 和 2016 VSTO 加载项项目然后单击项目添加新项目 gt 功能区可视化设计器则一切正常我启动了应用程序我的功能区显示在 Excel 中但是如果我首先
我应该使用函数还是无状态函子？

这两段代码做同样的事情如您所见它将用于排序函数哪个更好我通常写后一种但我看到一些程序员像以前那样做 struct val lessthan binary function
未定义条件编译符号

我无法让 Visual Studio 按照我的预期运行我创建了 2 个配置文件一个定义了符号 FOO 另一个定义了符号 BAR 我有这个代码 static class MyClass if FOO public static strin
NHibernate 中具有不同类型答案的问题

我正在尝试找到一个问卷问题的简洁解决方案假设我有一个Questionnaire类有一个集合Answers e g public class Questionnaire public virtual ISet
Boost async_write问题

我将展示一些代码 void wh const boost system error code ec std size t bytes transferred std cout lt lt test int main int argc cha
专家 C#/.Net/WPF 开发人员应该了解哪些知识？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何使用包含的转换的排名来比较两个标准转换序列

include
如何带参数调用外部程序？

我想在我的代码中调用一个 Windows 程序并使用代码本身确定的参数我不想调用外部函数或方法而是调用 WinXP 环境中的实际 exe 或批处理脚本文件 C 或 C 将是首选语言但如果使用任何其他语言更容易完成此操作请告诉我
无论表单上的焦点控件如何，如何捕获 Keys.F1？

我使用了 KeyDown 事件和一些简单的代码例如if e KeyCode Keys F1 捕获在表单上按下 F1 但如果表单上有一些文本框或者表单上有一些带有 Dock Fill 的电子表格则上面的代码将毫无用处并且不执行任何操作
Yield Return == IEnumerable 和 IEnumerator 吗？

Is yield return实施的捷径IEnumerable and IEnumerator 是的您可以在我的书 C in Depth 的第 6 章中找到更多相关信息幸好第六章是免费提供 http www manning source
在 C# 中将 ulong 映射到 long ？

我正在尝试将 ulong 映射到 long 反之亦然将 uint 映射到 int 反之亦然如下所示为了将值保存在具有签名类型的 MS SQL 数据库中仅限整数和大整数我这样做是因为我必须检查在数据库中一个数字 uint ulon
父窗体中的居中消息框[重复]

这个问题在这里已经有答案了有没有一种简单的方法可以在 net 2 0中将MessageBox居中于父窗体中我在 C 中确实需要这个并发现中心消息框 C http bytes com topic c sharp answers 26712
当另一个进程使用 std::fstream 写入文件时从文件读取[重复]

这个问题在这里已经有答案了我需要从文件中逐行读取它是由 std getline 完成的另一个进程的问题是一直向其附加数据然后我需要读取新行例如文件一开始包含10行我的程序读取了10行那么我的程序应该等待过了一会儿另一个进
使用 wmi 获取活动会话（Win32_LogonSession 还返回非活动/旧会话）

有没有办法只显示 wmi 的活动会话问题是 Win32 LogonSession 还显示不活动断开连接的会话 ManagementScope scope new ManagementScope ManagementPath Defaul
你将如何开始自动化我的工作？ - 第2部分

后续这个问题 https stackoverflow com questions 2796128 how would you start automating my job 在经历了第一波进货 9 小时的复制粘贴后我现在相信我已经满足
C++20 范围太多 |运营商？

我在这段代码中使用 g 10 2 有谁知道为什么我最后收到编译器错误std views reverse on results3 include

随机推荐

MatDialog 内部的动画不起作用

我有组件对话框我将在其中动态添加删除组件另外我确实在进入离开时有动画因此当删除组件并添加新组件时我希望以动画方式滑入滑出但 MatDialog 内部不起作用我认为问题出在动画上但是当我将在对话框中显示的组件插入到使用
如何显示由onclick事件触发的div

我有两个divs 我想显示一个div 其中还有其他div在里面当onclick事件被触发任何帮助或建议将不胜感激干得好 div display none document querySelector button addEventLi
为什么不总是配置事件中心分区的最大数量？

The Azure 事件中心概述 https azure microsoft com en us documentation articles event hubs overview 文章指出以下内容分区数量在事件中心创建时指定且必须在
C# - Debug.WriteLine - 此函数是异步的吗？

我刚刚遇到一种情况我正在调试一个迭代大量数据的线程我正在使用 Debug WriteLine 打印正在处理的记录刚刚发生的事情是该线程报告它已处理所有记录但是 Visual Studio 的调试窗口仍然显示我确信线程已经完成了它的
如何使用自定义挂钩在组件之间共享状态数据？

我有以下自定义挂钩useFlash import useState from react export default function useFlash const messages setMessages useState const
反映参数名称：滥用 C# lambda 表达式还是语法精妙？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在看MvcContrib http www codeplex com MVCContrib网格组件我对其中使用的语法技巧着迷但同时又感到
如何让 npm 启动 Angular 和 Node 服务器

是否可以使用 npm 启动 Angular 默认服务器端口 4200 和 Node js 端口 8080 包 json start ng serve node server js 如果我跑npm 启动仅 Angular 服务器 4200
使用 gson 和 GsonBuilder() 解析 JSON

String jsons appname application Version 0 1 0 UUID 300V WWXY 310W ABCD 270B YUDE 280T 这是我的 json 字符串我如何将它解析为 GsonBuilde
强制 gsub 保留尾随零

我想提取后面的数字来自 data frame 1 并将它们存储在第二列中如下所示 1 6 354 354 2 6 355 355 3 6 363 363 4 6 367 367 5 6 378 378 6 6 419 419 7 6 4
如何将 Jar 文件传递到 OOZIE shell 节点中的 shell 脚本

您好我在 oozie shell 操作工作流程中执行的脚本中运行 java 程序时遇到以下错误 Stdoutput 2015 08 25 03 36 02 636 INFO pool 1 thread 1 ProcessExecute j
Laravel Echo 在本地工作，但部署后就不再工作

我的通知在本地工作但是一旦部署到生产环境它就不会在控制台中显示任何内容 pushonce custom scripts endpushonce 如果我打开
排序时出现“范围坐标超出纸张尺寸”错误

我正在尝试创建一个脚本来对当前活动工作表选项卡上的表格进行排序但收到一个无法识别的错误我不断得到The coordinates of the range are outside the dimensions of the sheet
与内置函数的命名冲突[重复]

这个问题在这里已经有答案了我犯了一个错误如下所示 gt gt gt list a b c 但现在我想使用内置函数list 可以看到 listname之间存在命名冲突list和内置函数list 我该如何使用list作为内置函数而不是变量而
AngularJS 对输入类型日期进行日期格式验证

我正在尝试使用 AngularJS 创建日期并按照文档输入带有日期验证和转换在没有的浏览器中但支持 HTML5 日期输入将使用文本元素在那里面在这种情况下文本必须以有效的 ISO 8601 日期格式输入 yyyy MM dd
Factory Girl 的“捆绑安装”过程中出现“Invalid gemspec”消息（rails 3.1 和 ruby 1.9.2p290）

Note 当我在做时收到意外消息时我问了这个问题bundle install与factory girl使用 Ubuntu 11 10 的 gem 作为一个菜鸟我曾经并且仍然不知道发生了什么下面的更新试图概述我为最终摆脱这些消息所做
在可移植类库中使用 F# JsonProvider 失败

我正在尝试使用 JsonProvider 当我调用它的函数时出现以下错误 System TypeInitializationException was unhandled Message An unhandled exception of
如何使用 Jackson 注释从 HttpResponse 反序列化 JSON 对象？

我使用 Apache http 类来调用 Web 服务该服务在响应正文中返回 JSON 对象我有一个 Jackson 注释的 java 类映射到 JSON 对象我想做一些事情但谷歌还没有找到正确的样板 String url host
通过套接字将视频流传输到 html5 视频标签

你好我一直在尝试通过 socket io 套接字将 webm 视频直接流式传输到 html5 视频标签客户端和服务器端代码如下 Server function var Alert Channel Receiver Takeover ex
获取 Google 服务帐户的签名 Jwt 令牌

我正在尝试为 google 服务帐户生成签名的 JWT 令牌 now int time time expires now 900 15 mins in seconds can t be longer payload iat now exp
MPI_Type_create_subarray 和 MPI_Gather

我必须解决一些 mpi 问题我有 4 个从进程每个进程都想发送一个 2d 子数组 CHUNK ROWS X CHUNK COLUMNS 到 master 0 Master 0 收集 ddd ROWS COLUMNS 中的所有块并打印它

MPI_Type_create_subarray 和 MPI_Gather

MPI_Type_create_subarray 和 MPI_Gather 的相关文章

随机推荐

热门标签