我正在 C/MPI 中构建一个分布式 Web 服务器,在我的代码中的第一个 MPI_BARRIER 之后,点对点通信似乎完全停止工作。标准 C 代码在屏障之后工作,因此我知道每个线程都可以通过屏障。点对点通信在障碍物之前也能正常工作。但是,当我将在屏障之前的行工作的相同代码复制粘贴到屏障之后的行时,它完全停止工作。 SEND 将永远等待。当我尝试使用 ISEND 时,它会通过线路,但从未收到消息。我经常在谷歌上搜索这个问题,每个对 MPI_BARRIER 有问题的人都被告知屏障工作正常,而他们的代码是错误的,但我一生都无法弄清楚为什么我的代码是错误的。什么可能导致这种行为?
这是一个演示这一点的示例程序:
#include <mpi.h>
#include <stdio.h>
int main(int argc, char *argv[])
{
int procID;
int val;
MPI_Status status;
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &procID);
MPI_Barrier(MPI_COMM_WORLD);
if (procID == 0)
{
val = 4;
printf("Before send\n");
MPI_Send(&val, 1, MPI_INT, 1, 4, MPI_COMM_WORLD);
printf("after send\n");
}
if (procID == 1)
{
val = 1;
printf("before: val = %d\n", val);
MPI_Recv(&val, 1, MPI_INT, MPI_ANY_SOURCE, MPI_ANY_TAG, MPI_COMM_WORLD, &status);
printf("after: val = %d\n", val);
}
MPI_Finalize();
return 0;
}
移动两人if
屏障之前的语句会导致该程序正确运行。
EDIT- 看来第一次通信,无论类型如何,都能正常工作,而以后的所有通信都会失败。这比我一开始的想法要普遍得多。无论第一次通信是障碍还是其他消息,未来的通信都无法正常工作。