如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？

2024-05-06

我花了几个小时来挖掘这种行为，首先是关于这些问题：

`write(2)` 到本地文件系统的原子性 https://stackoverflow.com/questions/10650861/atomicity-of-write2-to-a-local-filesystem
如何同步（使原子化）从两个进程写入一个文件？ https://stackoverflow.com/questions/6896011/how-can-i-synchronize-make-atomic-writes-on-one-file-from-from-two-process
如何以编程方式确定“写入”系统调用对特定文件是否是原子的？ https://stackoverflow.com/questions/7660293/how-does-one-programmatically-determine-if-write-system-call-is-atomic-on-a-pa
如果两个不同的进程同时对同一文件调用写入系统调用，会发生什么情况 https://stackoverflow.com/questions/7236475/what-happens-if-a-write-system-call-is-called-on-same-file-by-2-different-proces
http://article.gmane.org/gmane.linux.kernel/43445 http://article.gmane.org/gmane.linux.kernel/43445

看来如果我们在打开文件时使用“O_APPEND”标志，那么在 Linux 上从多个进程登录到同一个文件总是可以的。我相信 python 肯定在其日志记录模块中使用“O_APPEND”标志。

从一个小测试来看：

#!/bin/env python
import os
import logging

logger = logging.getLogger('spam_application')
logger.setLevel(logging.DEBUG)
# create file handler which logs even debug messages
fh = logging.FileHandler('spam.log')
logger.addHandler(fh)
formatter = logging.Formatter(
    '%(asctime)s - %(name)s - %(levelname)s - %(message)s')
fh.setFormatter(formatter)

for i in xrange(10000):
    p = os.getpid()
    logger.debug('Log line number %s in %s', i, p)

我运行它：

./test.py & ./test.py & ./test.py & ./test.py &

我发现spam.log没有任何问题。这种行为或许可以支持上面的结论。

但问题随之而来：

这是什么意思here https://docs.python.org/2/howto/logging-cookbook.html#logging-to-a-single-file-from-multiple-processes?
以及使用场景有哪些this https://pypi.python.org/pypi/ConcurrentLogHandler/0.9.1，只是为了文件轮换？

最后，如果两个进程正在同一个文件上进行写入，我的意思是它们正在同一个文件上调用 write(2)，谁确保来自两个进程的数据不会交错（内核或文件系统？），以及如何交错。[注意：我只是想深入了解 write 系统调用，欢迎任何有关此的点击。]

EDIT1 :

Do this https://docs.python.org/2/howto/logging-cookbook.html#logging-to-a-single-file-from-multiple-processes and this https://pypi.python.org/pypi/ConcurrentLogHandler/0.9.1只是为了不同操作系统环境（如 Windows、Linux 或 Mac）之间的兼容性而存在？

EDIT2 :

再进行一项测试，每次向logging.debug提供8KB字符串。这次我可以在 spam.log 中看到“交错”行为。此行为正是上面一页中有关 PIPE_BUF 的指定内容。所以看起来 Linux 上的行为很清楚，如果 write(2) 的大小小于 PIPE_BUF，则使用 O_APPEND 是可以的。

我越挖越深。现在我想这些事实已经很清楚了：

使用 O_APPEND，多个进程的并行 write(2) 就可以了。只是行的顺序未确定，但行不会相互交错或覆盖。根据尼尔·道格拉斯 (Niall Douglas) 的回答，数据的大小是任意数量的了解多个进程的并发文件写入 https://stackoverflow.com/questions/12942915/understanding-concurrent-file-writes-from-multiple-processes。我已经在linux上对此进行了“任意数量”的测试，但没有找到上限，所以我想这是正确的。
没有O_APPEND，就会乱七八糟。 POSIX 是这样说的：“POSIX.1-2008 的本卷没有指定从多个进程并发写入文件的行为。应用程序应该使用某种形式的并发控制。”
现在我们进入Python。我在 EDIT3 中进行的测试，即 8K，我找到了它的起源。 Python的write()实际上使用了fwrite(3)，而我的python在这里设置了一个BUFF_SIZE，即8192。根据abarnert的回答Linux 上文件的默认缓冲区大小 https://stackoverflow.com/questions/18194374/default-buffer-size-for-a-file。这个8192的故事说来话长。

不过，欢迎提供更多信息。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？的相关文章

从 Python 中的 message_from_string() 获取发件人地址

有人可以告诉我如何在Python中从email message from string 获取发件人地址吗谢谢我试过 message email message from string email text from message Fr
setColumnStretch 和 setRowStretch 如何工作

我有一个使用构建的应用程序PySide2它使用setColumnStretch用于柱拉伸和setRowStretch用于行拉伸它工作得很好但我无法理解它是如何工作的我参考了 qt 文档但它对我没有帮助我被困在括号内的两个值上例如
使用 pyppeteer 与 asyncio 关联来抓取内容

我用 python 结合编写了一个脚本pyppeteer随着asyncio从其登陆页面抓取不同帖子的链接并最终通过跟踪通向其内页的 url 来获取每个帖子的标题我这里解析的内容不是动态的但是我利用了pyppeteer and asy
如何进行重定向并保留查询字符串？

我想进行重定向并保留查询字符串就像是self redirect加上发送的查询参数那可能吗 newurl my new route urllib urlencode self request params self redirect ne
关于具有自定义损失的 3 输出 ANN 的加权

我正在尝试定义一个自定义损失函数它在回归模型中接收 3 个输出变量 def custom loss y true y pred y true c K cast y true float32 Shape batch size 3 y pre
熊猫系列到二维数组

所以我使用了来自的答案将二维数组放入 Pandas 系列中 https stackoverflow com questions 38840319 put a 2d array into a pandas series将 2D numpy
如何使用 Python 在表单中选择选项？

我想知道如何以格式如下的形式选择选项 td align left td
如何在 tkinter 后台运行函数[重复]

这个问题在这里已经有答案了我是 GUI 编程新手我想用 tkinter 编写一个 Python 程序我想要它做的就是在后台运行一个可以通过 GUI 影响的简单函数该函数从 0 计数到无穷大直到按下按钮为止至少这是我想要它做的但
如何在使用 Flask for Python 3 的同时使用 Bootstrap 4？

我检查过发现默认安装时 Flask Bootstrap 原生使用 Bootstrap 3 3 7 但实际上我想通过使用 Flask Bootstrap 包在我的项目中使用 Bootstrap 4 任何有关如何更新它或类似内容的帮助将不胜感
使用张量流导出神经网络的权重

我使用张量流工具编写了神经网络一切正常现在我想导出神经网络的最终权重以制定单一的预测方法我怎样才能做到这一点您需要在训练结束时使用以下命令保存模型tf train Saver https www tensorflow org ver
Pandas 根据条件替换数据框值

我有一个主数据框 df Colour Item Price Blue Car 40 Red Car 30 Green Truck 50 Green Bike 30 然后我有一个价格修正数据框 df pc Colour Item Price
PySpark DataFrame 上分组数据的 Pandas 式转换

如果我们有一个由一列类别和一列值组成的 Pandas 数据框我们可以通过执行以下操作来删除每个类别中的平均值 df DemeanedValues df groupby Category Values transform lambda g
Python：如何“杀死”类实例/对象？

我希望 Roach 类在达到一定量的饥饿时死亡但我不知道如何删除该实例我的术语可能有误但我的意思是窗户上有大量蟑螂我希望特定的蟑螂完全消失我会向您展示代码但它很长我将蟑螂类添加到策划者类蟑螂种群列表中一般来说每个
从 SUDS 中的 SOAP 响应中提取 Cookie

我必须使用具有多种服务的 API 所有这些都需要来自下面的身份验证的 JSESSION cookie 然而当我调用下一个服务时它不会保留 cookie 因此会拒绝它们 from suds client import Client url
从函数在 python 3 中创建全局变量

我想知道为什么在函数结束后我无法访问变量 variable for raw data 代码是这样的 def htmlfrom Website URL import urllib request response urllib request
python 中“重载”函数的最佳方法？ [复制]

这个问题在这里已经有答案了我正在尝试在 python 中做这样的事情 def foo x y do something at position x y def foo pos foo pos x pos y 所以我想根据我提供的参数数量调
如何将另一整列作为参数传递给 pandas fillna()

我想用另一列中的值填充一列中的缺失值使用fillna方法我读到循环遍历每一行将是非常糟糕的做法最好一次完成所有事情但我不知道如何使用fillna 之前的数据 Day Cat1 Cat2 1 cat mouse 2 dog eleph
Python 中的可逆 STFT 和 ISTFT

有没有通用的形式短时傅立叶变换 https en wikipedia org wiki Short time Fourier transform与内置于 SciPy 或 NumPy 或其他什么中的相应逆变换这是pyplotspecgram
从 HDF5 文件中删除信息

我意识到 SO 用户以前曾问过这个问题question https stackoverflow com questions 1124994 removing data from a hdf5 file rq 1但它是在 2009 年被问到的
Python 子进程：无法转义引号

我知道以前曾问过类似的问题但它们似乎都是通过重新设计参数的传递方式即使用列表等来解决的但是我这里有一个问题因为我没有这个选项有一个特定的命令行程序我使用的是 Bash shell 我必须向其传递带引号的字符串它不能不被引用

随机推荐

如何正确使用 liquibase `searchPath` 选项来指示各自的资源文件夹？

我正在尝试调用update的命令liquibase如下 liquibase update changelog file persistence src main resources changelog db changelog dev xm
Three.js - 如何翻译几何图形

我有一个脚本可以定位各种宽度高度和深度的立方体并且正在努力根据 xAxis yAxis 和 zAxis 也有所不同将它们准确地排列起来 var geometry new THREE BoxGeometry width height
如何按外部值对 Django QuerySet 进行排序？

我有一个由 id rank 对组成的字典我想对 ids 执行 Django 查询以便生成的查询集按排名降序排序获取查询集很容易 rankings result MyModel objects filter id in rankin
对象关系映射继承

有没有人really想要并使用过 ORM 工具的继承支持如果是的话您认为哪一个提供最好的支持或者ORM继承是一个天上掉馅饼的概念吗我已经在 Hibernate 中使用了继承还有一些在 Django 中并且非常后悔组合优于继
如何在一个文本框中搜索多个值并在 DataGridView vb.net 中显示

有没有一种方法可以在一个文本框中搜索过滤多个值我正在 OPIS 列中搜索两个或多个不同的单词短语 Example 搜索 sveder 然后搜索 din 374 然后搜索 TiN 结果将是具有此描述的所有项目我有这段代码但是当搜索与
ZXing 无法正确读取巴西条形码钞票（交错的 2 个，共 5 个）。我该如何修复它？

我使用 XZing 2 3 0 读取 ITF 条形码但 ZXing 无法正确读取 47 位巴西钞票以下示例条形码图像可以在这里找到 http www shimatai com br images boleto png 被读作03391
一个同时接受 std::vector 和 QVector 的函数模板？

假设我有一个函数叫做loadData 它需要一个容器填充数据和一个 CSV 文件我需要以下重载 loadData std vector
从多行中选择数据并对其进行排序[重复]

这个问题在这里已经有答案了 id title content class 1 t1 p1 1 2 t2 p6 1 3 t3 p5 2 4 t4 p8 3 对于这个表我如何使用 1 个查询来SELECT所有课程DISTINCTLY变成这个
如何使用 xpointer 和 Xinclude 来引用元素

我想将 2 个具有相同结构的 XML 文件合并为一个例如测试1 xml
emberjs 无法克隆未实现 Ember.Copyable 的 Ember.Object

我正在使用 ember 1 3 1 和 ember data 1 0 0 beta 5 在创建新模式时我收到以下错误断言失败无法克隆未实现 Ember Copyable 的 Ember Object 以下是我的模型代码 App myM
如何在列表中使用 CSS 计数器而不重置计数器？

我想要有多个 ol 列表其中计数器值not在列表之间重置另一种说法是我希望第二个列表中第一个 li 的计数器比前一个列表最后一个元素的计数器值高一个有什么 CSS 魔法可以做到这一点吗 While 苏的回答 https stacko
多重集删除最后一个元素

我试图使用以下方法删除多重集的最后一个元素 minheap erase minheap rbegin 它无法编译并出现 4 5 个错误请注意在 C 多重集中 end 指向最后一个元素的旁边而不是最后一个元素有任何想法吗 EDIT
JSON 和 JavaScript 对象有什么区别？ [复制]

这个问题在这里已经有答案了我对 JSON 和 JavaScript 对象很陌生有人可以解释一下 JSON 和 JavaScript 对象之间的区别吗它们的用途是什么这个比那个好吗还是要看情况而定何时使用哪一个在什么情况下使用
ios 将 alpha 通道视频叠加在另一个视频上

我一直在尝试创建一个视频模板该模板使用 alpha 通道视频叠加在 mp4 视频和图像上这就是我需要创建视频的方式http viewptch ptchcdn com rendered 52b28a9f8d4f980f3a3f99c3 c
如何使用 HTML/CSS/jQuery 编写复数分数？

我希望能够使用 HTML CSS jQuery 编写分数而不是使用 TeX 渲染器甚至 MathML 目前有一个很好的解决方法可以编写简单的分数如果您有one term对于分子和分母来说但是一旦你开始使用多个术语它看起来就相当可怕
mockito：如何在java 8中匹配可变参数？

我正在努力将项目从 java 7 迁移到 8 并且在 Mockito 何时情况下遇到编译错误我很难追踪 when queryRunner query any String class any ResultSetHandler class
为什么即使显式抛出错误也没有被捕获？

我想使用带注释的 ExceptionHandler 捕获 SpringMVC3 中的错误我可以捕获可抛出异常和任何异常但是当我尝试使用 Error 时它没有捕获异常知道为什么吗下面的代码演示了这个问题 Controller Re
$PATH 中 /usr/bin 和 /usr/local/bin 等的顺序

在我的 Mac 上我经常使用 bash 对于我的环境设置我添加了 usr bin and usr local bin into PATH就像我平常做的那样虽然我知道什么 usr bin and usr local bin关于我很好奇
Android 手机号码验证

如何检查电话号码是否有效长度最大为13 包括字符在前我怎么做我试过这个 String regexStr 0 9 String number entered number getText toString if entered num
如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？

我花了几个小时来挖掘这种行为首先是关于这些问题 write 2 到本地文件系统的原子性 https stackoverflow com questions 10650861 atomicity of write2 to a local f

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？ 的相关文章

随机推荐

热门标签

如果我从 python 中的多个不同进程登录到同一个文件，会发生什么？的相关文章