高可用性计算：如何处理不返回的系统调用，而不冒误报的风险？

2023-12-08

我有一个进程在 Linux 计算机上运行，作为高可用性系统的一部分。该进程有一个主线程，用于接收来自网络上其他计算机的请求并响应它们。还有一个心跳线程定期发送多播心跳数据包，让网络上的其他进程知道该进程仍然存在并且可用 - 如果它们在一段时间内没有收到任何心跳数据包，则其中之一他们将假设该进程已经死亡并将接管其职责，以便整个系统可以继续工作。

这一切都运行得很好，但有一天整个系统失败了，当我调查原因时，我发现了以下内容：

由于（显然）盒子的 Linux 内核中存在错误，该进程的主线程进行的系统调用引发了内核“oops”。
由于内核“oops”，系统调用永远不会返回，导致进程的主线程永久挂起。
心跳线程 OTOH 继续正确运行，这意味着网络上的其他节点从未意识到该节点发生故障，并且没有一个节点介入来接管其职责......因此所请求的任务没有执行并且系统的运行实际上停止了。

我的问题是，是否有一个优雅的解决方案可以处理此类故障？（显然要做的一件事是修复 Linux 内核，这样它就不会“哎呀”，但考虑到 Linux 内核的复杂性，如果我的软件也能更优雅地处理未来的其他内核错误，那就太好了）。

我不喜欢的一种解决方案是将心跳生成器放入主线程中，而不是将其作为单独的线程运行，或者以其他方式将其绑定到主线程，这样如果主线程无限期地挂起，心跳不会被发送。我不喜欢这个解决方案的原因是因为主线程不是实时线程，因此这样做会引入偶尔误报的可能性，其中缓慢完成的操作被误认为是节点故障。如果可以的话，我希望避免误报。

理想情况下，有某种方法可以确保失败的系统调用返回错误代码，或者如果不可能，则使我的进程崩溃；其中任何一个都会停止心跳数据包的生成并允许故障转移继续进行。有什么方法可以做到这一点，或者不可靠的内核是否也会导致我的用户进程不可靠？

我的第二个建议是使用 ptrace 来查找当前指令指针。您可以有一个父线程来跟踪您的进程并每秒中断它以检查当前的 RIP 值。这有点复杂，所以我编写了一个演示程序：（仅限 x86_64，但这应该可以通过更改寄存器名称来修复。）

#define _GNU_SOURCE
#include <unistd.h>
#include <sched.h>
#include <stdlib.h>
#include <stdio.h>
#include <sys/syscall.h>
#include <sys/ptrace.h>
#include <sys/wait.h>
#include <sys/types.h>
#include <linux/ptrace.h>
#include <sys/user.h>
#include <time.h>

// this number is arbitrary - find a better one.
#define STACK_SIZE (1024 * 1024)

int main_thread(void *ptr) {
    // "main" thread is now running under the monitor
    printf("Hello from main!");
    while (1) {
        int c = getchar();
        if (c == EOF) { break; }
        nanosleep(&(struct timespec) {0, 200 * 1000 * 1000}, NULL);
        putchar(c);
    }
    return 0;
}

int main(int argc, char *argv[]) {
    void *vstack = malloc(STACK_SIZE);
    pid_t v;
    if (clone(main_thread, vstack + STACK_SIZE, CLONE_PARENT_SETTID | CLONE_FILES | CLONE_FS | CLONE_IO, NULL, &v) == -1) { // you'll want to check these flags
        perror("failed to spawn child task");
        return 3;
    }
    printf("Target: %d; %d\n", v, getpid());
    long ptv = ptrace(PTRACE_SEIZE, v, NULL, NULL);
    if (ptv == -1) {
        perror("failed monitor sieze");
        exit(1);
    }
    struct user_regs_struct regs;
    fprintf(stderr, "beginning monitor...\n");
    while (1) {
        sleep(1);
        long ptv = ptrace(PTRACE_INTERRUPT, v, NULL, NULL);
        if (ptv == -1) {
            perror("failed to interrupt main thread");
            break;
        }
        int status;
        if (waitpid(v, &status, __WCLONE) == -1) {
            perror("target wait failed");
            break;
        }
        if (!WIFSTOPPED(status)) { // this section is messy. do it better.
            fputs("target wait went wrong", stderr);
            break;
        }
        if ((status >> 8) != (SIGTRAP | PTRACE_EVENT_STOP << 8)) {
            fputs("target wait went wrong (2)", stderr);
            break;
        }
        ptv = ptrace(PTRACE_GETREGS, v, NULL, &regs);
        if (ptv == -1) {
            perror("failed to peek at registers of thread");
            break;
        }
        fprintf(stderr, "%d -> RIP %x RSP %x\n", time(NULL), regs.rip, regs.rsp);
        ptv = ptrace(PTRACE_CONT, v, NULL, NULL);
        if (ptv == -1) {
            perror("failed to resume main thread");
            break;
        }
    }
    return 2;
}

请注意，这不是生产质量的代码。你需要做很多修复工作。

基于此，您应该能够确定程序计数器是否正在前进，并且可以将其与其他信息（例如/proc/PID/status) 来查找系统调用是否忙。您还可以扩展 ptrace 的使用来检查正在使用哪些系统调用，以便您可以检查等待的系统调用是否合理。

这是一个 hacky 解决方案，但我认为您不会找到解决此问题的非 hacky 解决方案。尽管存在黑客行为，但我不认为（这是未经测试的）它会特别慢；我的实现每秒暂停一次受监控的线程，持续很短的时间 - 我猜这将在 100 微秒的范围内。理论上，效率损失约为 0.01%。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

高可用性计算：如何处理不返回的系统调用，而不冒误报的风险？的相关文章

进程名称长度的最大允许限制是多少？

进程名称允许的最大长度是多少我正在读取进程名称 proc pid stat文件我想知道我需要的最大缓冲区我很确定有一个可配置的限制但就是找不到它在哪里根据man 2 prctl http man7 org linux man pa
如何确保 numpy BLAS 库可用作动态加载库？

The theano安装文档 http www deeplearning net software theano install html troubleshooting make sure you have a blas library指
具有少量父设备属性的 udev 规则

我需要复杂且通用的udev规则来确定插入任何 USB 集线器的特定端口的 USB 设备所以我必须结合设备树不同层的父属性我有这个 udevadm info query all name dev ttyUSB0 attribute wa
如何从类似于 eclipse 的命令行创建可运行的 jar 文件

我知道 eclipse 会生成一个可运行的 jar 文件其中提取并包含在该 jar 文件中的所有库 jar 文件从命令提示符手动创建 jar 文件时如何执行类似的操作我需要将所有 lib jar 解压到类文件夹中吗目前我正在使用 j
如何从 Linux 命令行获取视频文件的分辨率（宽度和高度）？

我一直在挖掘 mplayer mencoder 和 ffmpeg 文档但我似乎无法想出anything 我对输出格式不是特别挑剔因为我可以使用正则表达式将其拉出来我只是似乎无法首先获取数据 Use ffprobe https ffmp
套接字：监听积压并接受

listen sock backlog 在我看来参数backlog限制连接数量这是我的测试代码 server initialize the sockaddr of server server sin family AF INET ser
如何用X11复制到剪贴板？

使用 OS X 上的框架我可以使用以下命令将 PNG 复制到粘贴板在 C 中显然我可以将 NSPasteboard 与 Cocoa 一起使用 include
怎样才能使 Windows 成为一个开箱即用的 POSIX 兼容操作系统？

这个问题的动机是我的一个牵强的梦想即 nix 平台上可用的许多优秀软件可以轻松移植到 Windows 微软最近对开源和开放性采取了不同的方法所以我真的很想知道如果微软有这样的倾向这样的事情会有多可行我很好奇的一些更具体的事情是是否
gethostbyname() 或 getnameinfo() 如何在后台工作？

How gethostbyname or getnameinfo 在后台工作 include
InstaPy：“错误，无法确定 64 位 Linux 的正确文件名”

有人知道如何解决或解决这个问题吗来自控制台的堆栈跟踪执行后报告错误 InstaPy Version 0 6 9 Workspace in use home zanettra InstaPy Error unable to determi
伊迪德信息

重新定义问题有什么方法可以获取所连接显示器的序列号吗我想收集显示器的Eid信息当我使用 logverbose 选项运行 X 时我可以从 xorg 0 log 文件中获取它但问题是如果我切换显示器拔出当前显示器然后插入另一个显
停止服务时单元陷入故障状态（状态=143）[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这是我的问题我有 CentOS 和 java 进程在上面运行 Java进程是通过启动停止脚本来操作的它也创建了 java 实例的 p
无法执行'x86_64-conda_cos6-linux-gnu-gcc'：没有这样的文件或目录（pysam安装）

我正在尝试安装 pysam 执行后 python path to pysam master setup py build 这个错误的产生是 unable to execute x86 64 conda cos6 linux gnu gcc
为 Qt 应用程序创建 Linux 安装

我刚刚用 Qt Creator 制作了一个很棒的程序我对自己很满意如何将其从台式机移至笔记本电脑那么最好的方法是安装程序对吗对于 Ubuntu 这是一个 Debian 软件包对吗我怎么做有人这样做过吗他们可以分享 QT
Inotify linux 监视子目录

是否可以以这种模式监视目录 storage data usernames Download gt storage data Download 我需要监视每个用户的下载文件夹中是否进行了更改也许我需要创建所有路径的列表将其放入数组中并在
每个进程每个线程的时间量

我有一个关于 Windows 和 Linux 中进程和线程的时间量子的问题我知道操作系统通常为每个线程提供固定的时间量我知道时间量根据前台或后台线程而变化也可能根据进程的优先级而变化每个进程有固定的时间量吗例如如果操作系统为每个
Linux shell 脚本：十六进制数字到二进制字符串

我正在 shell 脚本中寻找一些简单的方法来将十六进制数字转换为 0 和 1 字符的序列 Example 5F gt 01011111 是否有任何命令或简单的方法来完成它或者我应该为其编写一些开关 echo ibase 16 obase
如何让“grep”从文件中读取模式？

假设有一个很大的文本文件我只想打印与某些模式不匹配的行显然我可以使用egrep v patter1 pattern2 pattern3 现在如果所有这些模式都在一个文本文件中怎么办最好的制作方法是什么egrep从文件中读取模式 g
Linux 桌面快捷方式和安装图标

我需要添加什么到我的 spec文件来创建桌面快捷方式并在安装过程中为快捷方式分配一个图标 rpm 如果需要脚本一个示例将非常有帮助您在 Linux 下使用 desktop 文件作为图标图标放置的位置取决于您使用的发行版和桌面环境由于
.NET Core 中的跨平台文件名处理

如何处理文件名System IO以跨平台方式运行类以使其在 Windows 和 Linux 上运行例如我编写的代码在 Windows 上完美运行但它不会在 Ubuntu Linux 上创建文件 var tempFilename Dat

随机推荐

将对象添加到具有骨干的第一个位置的集合中？

我有一个简单的函数可以将文件夹添加到名为文件夹的集合中 folderAdded function folder this folders add folder this el empty this render 默认情况下这会将对象添
如何使用 best_in_place gem 更改序列化数据？

我有一个包含序列化数据的模型我想使用best in place宝石当使用 best in place gem 时默认情况下这是不可能的如何才能做到这一点可以通过扩展来完成method missing and respond to
Okhttp3 - 接受所有证书并使用certificatePinner [重复]

这个问题在这里已经有答案了我正在尝试固定服务器的自签名证书我的 OkHttpClient 有两个参数第一个是 ssl Socket Factory final TrustManager trustAllCerts new TrustM
FileChannel#force 等同于 OutputStream#flush 吗？我总是需要调用它吗？

我有一堂课的作品就像FilterOutputStream public class WritableFilterChannel implements WritableChannel public WritableFilterChannel
asp.net-身份事务问题

我想创建一个在同一事务中具有角色的用户但我在实施时遇到问题为了在事务中使用 userStore 并且让它不自动保存更改并忽略我的事务我必须关闭 AutoSaveChanges 这使得它会等到我调用保存更改这工作正常但因为当我调用
SQL Server 2008 中如果存在则更新，否则插入[重复]

这个问题在这里已经有答案了我想知道我该如何使用UPSERT或者换句话说UPDATE if records exists Else enter new record在SQL Server中使用一条语句进行操作此示例展示了在 Oracle
访问派生类中的基类属性 - 在“类范围”中

class Outer object class InnerBase object var foo bar class Derived InnerBase var var baz NameError name var is not defi
NSButton setAction 选择器

我只想添加一个带有 setAction 参数的 NSButton NSRect frame NSMakeRect 10 40 90 40 NSButton pushButton NSButton alloc initWithFrame fr
如何获取存储在 localStorage 中的对象的值？

我在 localStorage 中存储了一个具有多个属性的对象它不包含像字符串或数字这样的单个值 localStorage 键的名称是UserData它的值是以下对象 key 1287C31D714BE16FBD44D093E4173CF
我用 Set.Fold F# 做错了什么

着色问题你好我正在尝试实现一个 bool 函数当颜色可以扩展到一个国家地区时该函数返回 true 否则返回 false 但我在使用集合时遇到问题因为我们无法对它们进行模式匹配我的代码 type Country string t
如何为 std::string 对象预分配内存？

我需要将文件复制到字符串中我需要某种方式为该字符串对象预分配内存以及直接将文件内容读入该字符串内存的方法 std string has a reserve method用于预分配 std string s s reserve 104857
XMLHttpRequest 文件上传在 IE11 中不起作用

您好我的页面上有以下 JS 它在 Chrome 和 Firefox 上运行良好但它不适用于 Internet Explorer 11 我是一名 salesforce 开发人员我不太了解 javascript 您能帮我找出问题出在哪里吗
在javascript中对两个布尔数组进行逻辑与运算？

在 ES6 中对两个布尔数组进行与运算的优雅功能解决方案是什么 const a1 true false false const a2 true true false 应该导致 true false false 使用可以使用数组 map迭代第
WordPress Ajax 请求返回 0

我不明白为什么没有返回任何内容我是 Ajax 的真正初学者我刚刚阅读了很多有关在 Wordpress 中使用 Ajax 的主题但这些示例对我来说非常高级这是我的JS代码combo checkout iRange js jQuery
如果我不关闭Python SQLite中的数据库连接怎么办

我正在做这样的事情 conn sqlite3 connect db filename with conn cur conn cursor cur execute with自动提交更改但文档没有提到关闭连接其实我可以用conn在后面的陈述
Swift 3.0：“IndexSet”类型的值没有成员“enumerateIndexesUsingBlock”

接收Value of type IndexSet has no member enumerateIndexesUsingBlock enumerateIndexesUsingBlock 处出错 Extension for creating
pandoc 生成的 docx 遗漏了方程中的斜体变量

我有以下带有嵌入 LaTeX 方程的 Markdown 片段 Fisher s linear discriminant newcommand cov mathrm cov newcommand A mathrm A renewcommand
jQuery：如何通过溢出获取不可见的内容：隐藏？

我试图将内容跨越多个页面 div 每个 div 的高度设置为 950px 这样我就可以正确输出为 pdf 我从一个 div 开始它使用溢出隐藏来嵌套所有内容理想情况下我想使用 jquery 查找超出查看范围隐藏的内容但我看不到
共享模式下的 Excel 下拉菜单

当我将 Excel 工作簿更改为共享模式并尝试复制并粘贴具有下拉列表数据验证列表的行时下拉列表消失只要工作簿不共享它就可以正常工作有什么解决办法吗将工作簿设置为取消共享复制粘贴您的数据然后再次共享工作簿共享工作簿有用的
高可用性计算：如何处理不返回的系统调用，而不冒误报的风险？

我有一个进程在 Linux 计算机上运行作为高可用性系统的一部分该进程有一个主线程用于接收来自网络上其他计算机的请求并响应它们还有一个心跳线程定期发送多播心跳数据包让网络上的其他进程知道该进程仍然存在并且可用如果它们在一段时间内

高可用性计算：如何处理不返回的系统调用，而不冒误报的风险？

高可用性计算：如何处理不返回的系统调用，而不冒误报的风险？ 的相关文章

随机推荐

热门标签

高可用性计算：如何处理不返回的系统调用，而不冒误报的风险？的相关文章