在不阻塞的情况下“通知”处理器的正确方法是什么？

2024-04-20

假设我有很多东西，我必须对所有这些东西进行一些操作。如果一个元素的操作失败，我想停止整个阵列的工作[这项工作分布在多个处理器上]。

我想实现这一目标，同时将发送/接收的消息数量保持在最低限度。另外，如果没有必要，我不想阻止处理器。

我该如何使用 MPI 来做到这一点？

这似乎是一个常见问题，没有简单的答案。其他两个答案都存在可扩展性问题。环形通信方式的通信成本是线性的，而在单向通信方式中MPI_Win-解决方案，单个进程将受到所有工作线程的内存请求的影响。这对于低数量的排名来说可能没问题，但在增加排名数量时会带来问题。

非阻塞集体可以提供更具可扩展性的更好的解决方案。主要思想是发布一个MPI_Ibarrier除了一个指定的根之外的所有等级。该根将通过以下方式侦听点对点停止消息MPI_Irecv并完成MPI_Ibarrier一旦它收到它。

棘手的部分是需要处理四种不同的情况“{root，non-root} x {found，not-found}”。也可能发生多个队列发送停止消息，需要在根上进行未知数量的匹配接收。这可以通过额外减少来解决，该减少计算发送停止请求的等级数量。

下面是一个在 C 语言中的示例：

#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>

const int iter_max = 10000;
const int difficulty = 20000;

int find_stuff()
{
    int num_iters = rand() % iter_max;
    for (int i = 0; i < num_iters; i++) {
        if (rand() % difficulty == 0) {
            return 1;
        }
    }
    return 0;
}

const int stop_tag = 42;
const int root = 0;

int forward_stop(MPI_Request* root_recv_stop, MPI_Request* all_recv_stop, int found_count)
{
    int flag;
    MPI_Status status;
    if (found_count == 0) {
        MPI_Test(root_recv_stop, &flag, &status);
    } else {
        // If we find something on the root, we actually wait until we receive our own message.
        MPI_Wait(root_recv_stop, &status);
        flag = 1;
    }
    if (flag) {
        printf("Forwarding stop signal from %d\n", status.MPI_SOURCE);
        MPI_Ibarrier(MPI_COMM_WORLD, all_recv_stop);
        MPI_Wait(all_recv_stop, MPI_STATUS_IGNORE);
        // We must post some additional receives if multiple ranks found something at the same time
        MPI_Reduce(MPI_IN_PLACE, &found_count, 1, MPI_INT, MPI_SUM, root, MPI_COMM_WORLD);
        for (found_count--; found_count > 0; found_count--) {
            MPI_Recv(NULL, 0, MPI_CHAR, MPI_ANY_SOURCE, stop_tag, MPI_COMM_WORLD, &status);
            printf("Additional stop from: %d\n", status.MPI_SOURCE);
        }
        return 1;
    }
    return 0;
}

int main()
{
    MPI_Init(NULL, NULL);

    int rank;
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    srand(rank);

    MPI_Request root_recv_stop;
    MPI_Request all_recv_stop;
    if (rank == root) {
        MPI_Irecv(NULL, 0, MPI_CHAR, MPI_ANY_SOURCE, stop_tag, MPI_COMM_WORLD, &root_recv_stop);
    } else {
        // You may want to use an extra communicator here, to avoid messing with other barriers
        MPI_Ibarrier(MPI_COMM_WORLD, &all_recv_stop);
    }

    while (1) {
        int found = find_stuff();
        if (found) {
            printf("Rank %d found something.\n", rank);
            // Note: We cannot post this as blocking, otherwise there is a deadlock with the reduce
            MPI_Request req;
            MPI_Isend(NULL, 0, MPI_CHAR, root, stop_tag, MPI_COMM_WORLD, &req);
            if (rank != root) {
                // We know that we are going to receive our own stop signal.
                // This avoids running another useless iteration
                MPI_Wait(&all_recv_stop, MPI_STATUS_IGNORE);
                MPI_Reduce(&found, NULL, 1, MPI_INT, MPI_SUM, root, MPI_COMM_WORLD);
                MPI_Wait(&req, MPI_STATUS_IGNORE);
                break;
            }
            MPI_Wait(&req, MPI_STATUS_IGNORE);
        }
        if (rank == root) {
            if (forward_stop(&root_recv_stop, &all_recv_stop, found)) {
                break;
            }
        } else {
            int stop_signal;
            MPI_Test(&all_recv_stop, &stop_signal, MPI_STATUS_IGNORE);
            if (stop_signal)
            {
                MPI_Reduce(&found, NULL, 1, MPI_INT, MPI_SUM, root, MPI_COMM_WORLD);
                printf("Rank %d stopping after receiving signal.\n", rank);
                break;
            }
        }
    };

    MPI_Finalize();
}

虽然这不是最简单的代码，但它应该：

不引入额外的阻塞
通过实施屏障（通常O(log N))
最坏情况下的延迟发现一个, to all stop2 * 循环时间（+ 1 p2p + 1 障碍 + 1 减少）。
如果许多/所有等级同时找到解决方案，它仍然有效，但可能效率较低。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

MPI

在不阻塞的情况下“通知”处理器的正确方法是什么？的相关文章

带有可运行对象和结果的 FutureTask

我用谷歌搜索了这个但仍然无法得到充分的理解我找不到任何使用的特定示例FutureTask Runnable runnable V result 构造函数 Java 文档说未来提交可运行任务 T结果提交一个 Runnable 任务来

随机推荐

如果最后一个地址是 0xFFFFFFFF，如何获取数组末尾之后的地址？

如果将地址放在数组末尾是合法的那么如果数组地址的最后一个元素是我该怎么做0xFFFFFFFF 这段代码将如何工作 for vector
将标准输出重定向到文件

我正在尝试执行相当于 bash 命令的操作ls gt foo txt in C 下面的代码将输出重定向到变量 include
使用 Perl 搜索并替换文件中的特定字符串[重复]

这个问题在这里已经有答案了可能的重复如何在 Perl 中替换现有文件中的字符串 https stackoverflow com questions 6994947 how to replace a string in an existi
使用变量访问 JSON 值

我正在尝试使用 jQuery 访问 JSON 数据并根据变量获取一组特定的值我在使用之前已经这样做过但由于某种原因我无法弄清楚这次出了什么问题我的 JSON 文件由 getJSON 读取并命名为 jsonmaker php 如下
使用 swagger 或任何其他工具生成 Rest API 文档

我正在寻找一种方法来记录我的 Rest API 我的服务器是 Tomcat Spring 服务器 Rest API 是使用 Jenkins 实现的 Swagger 似乎是一个非常酷的解决方案但我不知道如何在我的代码中使用它我正在寻找创建
Ecto 和 Elixir 的默认日期时间

我今天刚刚开始使用 Elixir 和 Phoenix 我正在尝试添加 Ecto 作为映射器但我在使用时间时遇到了一些问题这是我的模型 schema users do field name string field email strin
Python 字符串不是不可变的吗？那为什么a + " " + b 会起作用呢？

我的理解是 Python 字符串是不可变的我尝试了以下代码 a Dog b eats c treats print a b c Dog eats treats print a b c Dog eats treats print a Dog
在现有数据表中添加按顺序编号的新列的最佳方法

我有一个非空数据表添加另一列从 1 开始按顺序编号的最佳方法是什么我尝试了以下代码但没有成功 DataColumn dc new DataColumn Col1 dc AutoIncrement true dc AutoIncre
DIV 高度设置为屏幕百分比？

我希望将父 DIV 设置为 100 屏幕高度的 70 我已经设置了以下 CSS 但它似乎没有做任何事情 body font family Noto Sans sans serif margin 0 auto height 100 width
重载运算符 == 与 Equals()

我正在开发一个 C 项目到目前为止我已经使用不可变对象和工厂来确保类型的对象Foo总是可以比较是否相等 Foo对象一旦创建就无法更改并且工厂始终为给定的参数集返回相同的对象这非常有效并且在整个代码库中我们假设始终致力于检查相等性
postgresql - 将布尔列添加到表集默认值

这是正确的 postgresql 语法可以将列添加到表中默认值为false ALTER TABLE users ADD priv user BIT ALTER priv user SET DEFAULT 0 Thanks ALTER T
突变观察者可以监听“数据”属性的变化吗？

所以问题是我有一个 html 元素它在 data 属性中有一个对象通过 jQuery ofc 设置并且我想监听该属性的更改我已经尝试了很多事情比如在MutationObserverInit 对象 https developer m
什么时候使用 git rm -f ？

我正在学习 Git 无法理解在发出 git rm 命令时使用 f 标志的条件请解释一下需要 rm f 而不是仅 rm 的情况解释 The f如果文件与您上次签出的提交不是最新的则用于删除该文件这是为了防止您删除已进行更改但尚未签入的
Javascript，如何读取本地文件？

我尝试从服务器读取本地文件我已经谷歌这个话题有一段时间了有些人说这是不可能的有些人说这是可以做到的在搜索过程中我发现了这个脚本使用 xmlhttprequest 读取文件如果您的 javascript 应用程序的 HTML
如何在 jQuery keyup 事件中实现 debounce fn？

计算基于用户输入标准是使用keyup而不是change or blur 问题是代码在每次击键时都会触发而我需要它在 500 毫秒超时后仅延迟并触发一次我下面的例子显然不起作用附加了小提琴我找到了大卫沃尔什的dbounce功能但
.NET 4 自旋锁

以下测试代码 F 未返回我期望的结果 let safeCount let n 1000000 let counter ref 0 let spinlock ref lt SpinLock false let run i0 i1 for i
在 Kotlin 中使用 Room 的 @ForeignKey 作为 @Entity 参数

我遇到了一个房间tutorial https android jlelse eu android architecture components room relationships bf473510c14a这利用了 PrimaryKey类
如何将 NSDictionary 转换为自定义对象

我有一个 json 对象 interface Order NSObject property nonatomic retain NSString OrderId property nonatomic retain NSString Titl
Redhat 的 RHEL8 相当于“apk add --no-cache gcc musl-dev linux-headers”

我正在尝试使用安装在 RedHat enterprise linux 7 8 映像上的 Python 上的 https docs docker com compose gettingstarted 中的示例代码此行出现错误 127 RUN
在不阻塞的情况下“通知”处理器的正确方法是什么？

假设我有很多东西我必须对所有这些东西进行一些操作如果一个元素的操作失败我想停止整个阵列的工作这项工作分布在多个处理器上我想实现这一目标同时将发送接收的消息数量保持在最低限度另外如果没有必要我不想阻止处理器我该如何使用

在不阻塞的情况下“通知”处理器的正确方法是什么？

在不阻塞的情况下“通知”处理器的正确方法是什么？ 的相关文章

随机推荐

热门标签

在不阻塞的情况下“通知”处理器的正确方法是什么？的相关文章