当“正确”执行时，PID 文件仍然存在缺陷吗？

2023-11-25

重新启动服务通常是通过 PID 文件来实现的 - 即进程 ID 被写入某个文件，并且根据该编号，停止命令将终止该进程（或在重新启动之前）。

当你想到这一点时（或者如果你不喜欢这个，那么search）你会发现这是有问题的，因为每个 PID 都可以重复使用。想象一下服务器完全重新启动，您在启动时调用“./your-script.sh start”（例如 crontab 中的 @reboot）。现在 your-script.sh 将杀死一个随意的PID 因为它已经存储了实时的 PIDbefore重新启动。

我可以想象的一种解决方法是存储附加信息，以便您可以执行 'ps -pid | grep ' 并且只有当它返回一些东西时你才能杀死它。或者在可靠性和/或简单性方面有更好的选择吗？

#!/bin/bash

function start() {
  nohub java -jar somejar.jar >> file.log 2>&1 &
  PID=$!
  # one could even store the "ps -$PID" information but this makes the
  # killing too specific e.g. if some arguments will be added or similar
  echo "$PID somejar.jar" > $PID_FILE
}

function stop() {
  if [[ -f "$PID_FILE" ]]; then
    PID=$(cut -f1 -d' ' $PID_FILE)
    # now get the second information and grep the process list with this
    PID_INFO=$(cut -f2 -d' ' $PID_FILE)
    RES=$(ps -$PID | grep $PID_INFO)
    if [[ "x$RES" != "x" ]]; then
       kill $PID
    fi
  fi
}

PID 文件的问题是多方面的，不仅限于回收和重新启动。

更大的问题是 PID 文件中的信息和进程状态之间不可避免地存在脱节/竞争。

这是使用PID文件的流程：

您分叉并执行一个进程。 “父”进程知道 fork 的 PID，并保证该 PID 专门为其 fork 保留。
你的父进程将 fork 的 PID 写入一个文件。
你的父母去世了，随之而来的是 PID 独占性的保证。
A 不同的进程读取PID文件中的数字。
不同的进程检查系统上是否存在与他读取的PID相同的进程。
不同的进程向带有他读取的PID的进程发送信号。

在（1）中，一切都很好。我们有一个 PID，并且内核保证该数字是为我们预期的进程保留的。

在 (2) 中，您将对 PID 的控制权交给没有此保证的其他进程。其本身并不是问题，但这种行为很少是没有过错的。

在（3）中，你的父进程死亡。它独自拥有 PID 独占性的内核保证。它可能会也可能不会对 PID 执行 wait(2)。预期进程的真实状态丢失了，我们剩下的只是 PID 文件中的一个标识符，它可能引用也可能不引用预期进程。

在(4)中，进程没有任何保证读取PID文件，任何使用这个数字都只能任意成功。

在（5）中，没有任何保证的进程实际上使用了某些东西的标识符，这是我们实际上做坏事的第一点：我们使用可能引用也可能不引用预期进程的进程标识符来查询内核。我们将得到的答案将是具有该 PID 的进程的状态，而不一定是我们想要的进程的状态。

在（6）中，我们犯了最严重的错误：我们实际上正在执行一个变异操作，旨在影响我们最初启动的流程，但绝不保证该意图。我们可以向任何随机系统进程发出信号。

为什么是这样？什么样的事情会扰乱 PID？

(1) 之后的任何地方，真正的进程都可能终止。只要父进程保留对 PID 独占性的保证，内核就不会回收 PID。它仍然会存在，并引用您以前的进程（我们称之为“僵尸”进程，您的真实进程死亡，但 PID 仍为其单独保留）。没有其他进程可以使用此 PID，并且发出信号它根本不会到达任何进程。

一旦父进程释放其保证或在(3)之后，内核就会回收死亡进程的PID。僵尸进程消失了，PID 现在可供任何其他分叉的新进程使用。假设你正在编译一些东西，就会产生数千个小进程。内核为每个进程选择随机或顺序（取决于其配置）新的 PID。完成后，现在重新启动 apache。内核将死进程释放的 PID 重新用于重要的事情。

但 PID 文件仍然包含 PID。任何读取 PID 文件 (4) 的进程都假设该数字指的是早已死亡的进程。

您对所读取的数字执行的任何操作 (5) (6) 都将针对新流程，而不是旧流程。

不仅如此，您还不能在执行操作之前执行任何检查，因为您可以执行的任何检查和您可以执行的任何操作之间存在不可避免的竞争。如果你首先看ps看看你的进程的“名称”是什么（并不是说这是一个非常棒的保证，请不要这样做），然后向它发出信号，你的进程之间的时间ps检查并且您的信号仍然可能看到进程死亡，和/或被新进程回收。所有这些问题的根源在于内核没有为您提供对 PID 的任何独占使用保证，因为您不是其父级。

这个故事的寓意是：不要将您孩子的 PID 告诉其他任何人。父级并且只有父级应该使用它，因为他是系统上唯一对其存在和身份有任何保证的人（保存内核）。

这通常意味着让父进程保持活动状态，而不是发出信号来终止进程，而是与父进程交谈；通过插座等方式。看http://smarden.org/runit/ et al.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

bash

当“正确”执行时，PID 文件仍然存在缺陷吗？的相关文章

grep 以特定字符串开头的行

我想找到文件中以特定字符串开头的所有行问题是我事先不知道字符串里有什么该值存储在变量中天真的解决方案如下 grep my string file txt 因为如果 Bash 变量my string包含任何正则表达式特殊字符 grep
如何将动态链接的应用程序转换为静态链接的应用程序？

我有一个应用程序例如 gedit 它是动态链接的但我没有源代码所以我不能按我喜欢的方式编译它我想要做的是将其静态链接并将其移动到没有运行该应用程序所需的库的系统那么是否可以做到以及如何做到呢理论上是可能的您基本上必须执行与动态
如何在shell脚本中扩展相对路径

我正在编写一个脚本来使用 bash 在 linux 2 6 上设置环境变量因此该脚本包含如下命令 export SRC DIR export LIBPATH SRC DIR lib 问题是当我尝试 echo LIBPATH 时它显示
尽管 EXPORT_SYMBOL 模块插入时出现“模块中的未知符号”

我正在尝试编译并插入 r8169 realtek 以太网驱动程序我的内核版本是 ebin sony uname r 4 2 0 rc3 custom 我的本地磁盘中有相同的完整源代码用于安装当前的内核当我运行时该模块编译成功make
为什么不使用 sshrc 中设置的 $PATH？

我正在尝试在 OS X 服务器上通过 ssh 设置 svn 为了做到这一点我读到我需要一个包装器来设置 umask 并在我的例子中设置存储库根一种快速而肮脏的方法是重命名 usr bin svnserve并将包装器脚本放置在该位置
如何从 tcl 脚本调用 bash 命令？

Bash 命令可从交互式 tclsh 会话中获得例如在 tclsh 会话中您可以 ls 代替 exec ls 但是您不能有一个直接调用 bash 命令的 tcl 脚本或者没有exec 如何使 tclsh 在解释 tcl 脚本文件时
Cmake 错误未定义对“pthread_create”的引用

我对 cmake FindThreads 进行了测试这是我的源代码test cpp和CMakeLists txt include
SDL/C++ OpenGL 程序，如何阻止 SDL 捕获 SIGINT

我在用SDL http www libsdl org 用于在 Linux 上运行的 OpenGL 应用程序我的问题是 SDL 正在捕获 SIGINT 并忽略它这是一个痛苦因为我正在通过屏幕会话进行开发并且我无法使用 CTRL C 终
当我执行 pip --version 时，它显示错误为 ImportError：没有名为 pyparsing 的模块

我尝试安装卸载py解析以及它不起作用我被这个问题困住了我还必须安装额外的库这是错误消息 Traceback most recent call last File usr bin pip line 5 in
强制 shell 在 SunGrid 引擎中使用 conda 变量中的 python [重复]

这个问题在这里已经有答案了我正在尝试在 SunGrid 引擎中执行 python 文件并且从 anaconda3 环境变量中执行它我的代码很简单 from future import print function import url
ulimit -r 返回不同的值

我将以下两行添加到系统范围的 etc security limits conf 中 soft rtprio 55 hard rtprio 55 系统重新启动后根据我在计算机上访问用户帐户的方式我会得到两个不同的结果 user clien
使用 Python for Linux 模拟按键事件

我正在编写一个脚本来自动运行特定模型当模型失败时它会等待用户输入 Enter 键我可以检测到模型何时失败但我无法使用 python 在 Linux 上来模拟按键事件 Windows 有 SendKeys 库来执行此操作但我想知道
无法声明接口：资源繁忙

我正在使用 USB4Java 低级版本并且基本上是根据这段代码工作的here http www mets blog com java usb communication usb4java 我在 Ubuntu 中工作遇到了有关权限的问题
32 位 x86 汇编中堆栈对齐的职责

我试图清楚地了解谁调用者或被调用者负责堆栈对齐 64 位汇编的情况相当清楚它是由caller 请参阅系统 V AMD64 ABI 第 3 2 2 节栈帧输入参数区域的末尾应按 16 对齐 32 如果 m256 在堆栈字节边界上传递
检测目录中是否有某些内容被修改，如果是，则备份 - 否则不执行任何操作

我有一个数据目录我通过 shell 脚本定期同步到远程 NAS 但是我想让这变得更有效率我想在运行 rsync 之前检测数据中是否发生了变化这样我就不会不必要地唤醒 NAS 上的驱动器我正在考虑修改 shell 脚本以获取
Bash IF：多个条件

我已经尝试让这件事工作几个小时但我无法让它工作 if P SFTP a PORT 22 P FTPS PORT 990 a PORT 21 then 有人能帮我吗我知道多个条件可以这样写 if P SFTP PORT 22 then 但
UNIX 域 STREAM 和 DATAGRAM 套接字之间的区别？

这个问题是NOTSTREAM 类型和 DATAGRAM 类型 INTERNET 套接字之间的区别我知道 STREAM 套接字使用 TCP 数据报套接字使用 UDP 以及所有 TCP UDP 内容按顺序到达的数据包 ACK NACK 等
使用环境变量将参数传递给命令

我正在尝试编写一个 bash 脚本该脚本采用环境变量并将其传递给命令所以如果我有类似的东西 export OUT a arg1 b arg2 0 arg2 1 我想在我的 bash 脚本中执行以下操作
如何在不需要设置 LD_LIBRARY_PATH shell 变量的情况下输入“cargo run”？

我构建了一个 Rust 程序通过 C 接口调用 C 函数为了执行该程序我必须运行 export LD LIBRARY PATH
Bash：将输出传输到后台进程？

我想将一个进程放入后台然后多次将数据传递给它例如 cat The command I want to write into cat pid Getting the process id of the cat process echo h

随机推荐

Inno Setup，[Run] 中的空格和双引号

我正在尝试在 Windows 上安排任务但不幸的是它不起作用任务已创建但不正确当我查看任务的参数时它说 PROGRAM C Program ARGUMENTS Files x86 AppName executable exe 我
C++11 中的命名空间问题？

有人可以解释一下以下内容吗 cat test cpp include
使用 LinkMovementMethod 时可以禁用 TextView 中的滚动吗？

我在 textView 中使用可点击范围来仅允许部分文本可点击它工作正常只是 textView 向下滚动这是我不想要的发生这种情况是因为我使用 LinkMovementMethod 在需要时滚动有没有办法取消滚动 Spannabl
使用 Javascript 播放 HTML5 视频 [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我该如何使用JavaScript播放 HTML5
作为“本地系统”运行 Windows 服务有哪些安全风险？

我编写了一个作为本地系统运行的 NET Windows 服务最近我读到作为本地系统运行可能会将系统凭据暴露给黑客使他们能够接管系统当我作为本地系统运行服务时涉及哪些风险以及如何预防这些风险服务运行为LocalSystem是系
kubernetes 部署-容器未启动-错误- InvalidImageName

以下是 Kubernetes 部署 yaml 文件 container图片部分 image https registry ng bluemix net test service test branch 67 imagePullPolicy
PHP basename() 和 pathinfo() 与多字节 UTF-8 文件名

我发现 PHP 函数 basename 以及 pathinfo 对于多字节 utf 8 名称有奇怪的行为它们删除所有非拉丁字符直到第一个拉丁字符或标点符号但是此后后续的非拉丁字符将被保留 basename x returns x
是否可以使用 MongoDB 作为嵌入式数据库？

正如标题所示我喜欢将 MongoDB 服务器嵌入到我自己的 C 应用程序中我在文档中没有找到这种模式我正在寻找类似 SQLite 或 Firebird 的嵌入式模式 MongoDB 也可以实现这一点吗无需自己编程目前还没有办法嵌入
为什么 json_decode 对于空数组返回 null？

为什么这会回显 NULL 在我看来它将被解码为一个空数组我明显缺少什么吗这是因为array NULL 在这种情况下它不检查对象类型 gettype null 返回 null 而 gettype array 返回数组希望你能明白其中
在 python 中保存和处理内存中的大字典的有效方法

正如我做了一些测试一个包含 3000 万个项目的 int gt int 不同值的 python 字典可以轻松地占用我的 mac 上 gt 2G 的内存由于我只使用 int 到 int dict 有没有比使用 python dict 更
VSCode 如何自动插入 Intellisense 建议而无需按 Enter？

默认 VS Code 智能感知行为向用户呈现建议菜单 User then has to press the Up or Down arrow keys to navigate through the menu Finally user h
MPI_SEND 占用虚拟内存的很大一部分

在大量内核上调试我的程序时我遇到了非常奇怪的错误insufficient virtual memory 我的调查导致了代码的和平主站向每个从站发送小消息然后我写了一个小程序其中 1 个 master 只需发送 10 个整数MPI S
在 .net 4.5 中使用 ClientWebSocket 时如何设置 User-Agent 和 Referer 标头？

使用的明显答案ClientWebSocket SetHeader抛出异常因为它是受保护的标头 System ArgumentException occurred Message The User Agent header must be
如何检查列表中是否存在子序列？ [复制]

这个问题在这里已经有答案了在Python中可以使用is检查包含的关键字例如 gt gt gt 3 in 1 2 3 4 5 True 但是如果它检查单个整数的列表是否在引用列表内则不会产生相同的输出 1 2 3 4 5 gt gt
在不知道尺寸的情况下垂直居中图像

我在网络开发生涯中集中了很多东西但我想知道是否有一种简单的方法可以在不知道图像尺寸的情况下垂直居中图像想象一下我从数据库中获得的缩略图列表我不希望每个项目都粘在父 div 的顶部 div div img src path i got
更改使用 Mono 运行的 C# 应用程序中的当前 Linux 用户？

我正在为 Linux 系统开发一个库 CLI 程序集我想为图书馆的用户提供一种切换当前有效用户和组的方法主要原因是提供访问控制某些操作仅允许某些用户允许其次是允许特定用户修改文件系统我已经确定了两种可能的方法 1 以 root 身
即使已经安装了包，pip install 也总是克隆 git 存储库

有没有办法让 pip 检查 git 指定的包是否已经安装并完全跳过 git 克隆文档提到您可以在 Egg 定义之后指定版本但这只是为了用户的视觉方便并没有在任何地方使用对于我的用例解决方案是更改表单中的 URL git https
Ruby 正则表达式与 Python 正则表达式

Ruby 正则表达式和 Python 正则表达式之间有什么真正的区别吗我一直无法发现两者之间的任何差异但可能错过了一些东西我上次检查时发现它们在 Unicode 支持方面存在很大差异 1 9 中的 Ruby 至少有一些非常有限的 U
为initializer_list提供私有构造函数是否符合要求？

该标准草案显示了以下内容的概要 initializer list 它没有私有构造函数但我看过的两个标准库实现 libstdc 和 libc 都提供私有构造函数 The compiler can call a private constru
当“正确”执行时，PID 文件仍然存在缺陷吗？

重新启动服务通常是通过 PID 文件来实现的即进程 ID 被写入某个文件并且根据该编号停止命令将终止该进程或在重新启动之前当你想到这一点时或者如果你不喜欢这个那么search 你会发现这是有问题的因为每个 PID 都可以重复

当“正确”执行时，PID 文件仍然存在缺陷吗？

当“正确”执行时，PID 文件仍然存在缺陷吗？ 的相关文章

随机推荐

热门标签

当“正确”执行时，PID 文件仍然存在缺陷吗？的相关文章