如何在 wsgi 中启动 pdftk 子进程？

2023-11-24

我需要在 Django 中提供 Web 请求时启动 pdftk 进程，并等待它完成。我当前的 pdftk 代码如下所示：

proc = subprocess.Popen(["/usr/bin/pdftk", 
                         "/tmp/infile1.pdf", 
                         "/tmp/infile2.pdf", 
                         "cat", "output", "/tmp/outfile.pdf"])    
proc.communicate()

只要我在开发服务器下执行（以用户身份运行），这就可以正常工作www-data）。但是一旦我切换到 mod_wsgi，不做任何更改，代码就会挂在proc.communicate()，并且“outfile.pdf”保留为零长度的打开文件句柄。

我尝试了子进程调用的几种变体（以及普通的旧 os.system）——将 stdin/stdout/stderr 设置为 PIPE 或各种文件句柄不会改变任何内容。使用“shell=True”可以防止proc.communicate()挂起，但 pdftk 无法在 devserver 或 mod_wsgi 下创建输出文件。这次讨论似乎表明操作系统信号和 pdftk 可能存在一些我不明白的更深层次的巫术。

是否有任何解决方法可以让这样的子进程调用在 wsgi 下正常工作？我避免使用 PyPDF 来组合 pdf 文件，因为我必须组合足够多的文件（数百个），从而耗尽内存（PyPDF 需要在组合它们时使每个源 pdf 文件在内存中保持打开状态）。

我正在最近的 Ubuntu、pythons 2.6 和 2.7 下执行此操作。

尝试使用输入和输出文件的绝对文件系统路径。 Apache 下的当前工作目录与运行服务器的目录不同，可以是任何目录。

消除明显问题后的第二次尝试。

pdftk 程序是一个 Java 程序，它依赖于能够生成/接收 SIGPWR 信号来触发垃圾收集或执行其他操作。问题是，在守护程序模式下的 Apache/mod_wsgi 下，信号在请求处理程序线程内被阻止，以确保它们仅由寻找进程关闭触发事件的主线程接收。当您分叉进程来运行 pdftk 时，不幸的是，它从请求处理程序线程继承了被阻止的 sigmask。这样做的后果是它阻碍了 Java 垃圾收集过程的运行，并导致 pdftk 以奇怪的方式失败。

唯一的解决方案是使用 Celery 并让前端向 Celery 队列提交作业，以便 celeryd 然后 fork 并执行 pdftk。因为这是通过与 Apache 不同创建的进程完成的，所以您不会遇到此问题。

要了解更多血淋淋的细节，请 Google 搜索 mod_wsgi 和 pdftk，特别是在 Google 网上论坛中。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 wsgi 中启动 pdftk 子进程？的相关文章

Pyqt-如何因另一个组合框数据而更改组合框数据？

我有一个表有 4 列这 4 列中的两列是关于功能的一个是特征另一个是子特征在每一列中所有单元格都有组合框我可以在这些单元格中打开txt 我想当我选择电影院作为功能时我只想看到子功能组合框中的电影名称而不是我的数据中的
Python 是解释型的还是编译型的，或者两者兼而有之？

据我了解 An 解释的语言是由解释器将高级语言转换为机器代码然后执行的程序实时运行和执行的高级语言它一次处理一点程序 A compiled语言是一种高级语言其代码首先由编译器将高级语言转换为机器代码的程序转换为机器代码然后由执
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
设置 verify_certs=False 但 elasticsearch.Elasticsearch 因证书验证失败而引发 SSL 错误

self host KibanaProxy 自我端口 443 self user 测试 self password 测试我需要禁止证书验证使用选项时它与curl一起使用 k在命令行上但是在使用 Elasticsearch pytho
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
Python Django-如何从输入文件标签读取文件？

我不想将文件保存在我的服务器上我只想在下一页中读取并打印该文件现在我有这个 index html
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
Werkzeug 中的线程和本地代理。用法

首先我想确保我正确理解了功能的分配分配本地代理功能以通过线程内的模块包共享变量对象我对吗其次用法对我来说仍然不清楚也许是因为我误解了作业我用烧瓶如果我有两个或更多模块 A B 我想将对象C从模块A导入到模块B 但我
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
ModelChoiceField 在提交表单时给出无效选择错误

我想允许用户删除特定模型的关联外键列表假设我们有这两个模型 class IceBox models Model class FoodItem models Model name models CharField icebox models
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
将 python 字典中的数据呈现给 django 模板。

我有一本字典 data sok 1 10 sao 1 10 sok sao 2 20 我如何循环字典将我的数据作为 HTML 表呈现给 Django 模板这种格式为表格 author qty Amount sok 1 10 sao 1
[cocos2d-x]当我尝试在 Windows 10 中运行“python android-build.py -p 19 cpp-tests”时出现错误

当我尝试运行命令时python android build p cpp tests 我收到如图所示的错误在此之前我收到了另一条关于 Android SDK Tools 版本兼容性的错误消息所以我只是将 sdk 版本从 26 0 0
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

DisplayAlert 随着更改文本 xamarin 表单

我有一个要求我必须在 DisplayAlert 上显示下载状态但是可以异步更改文本如何实现这一目标 DisplayAlert Download Info Downloading Ok 我想显示状态例如已连接到服务器正在下载下载
在未知索引处分割向量

我在 R 中有一个向量其中至少包含 50 000 个实数这些值从小到大排序现在我需要将该向量拆分为不同的向量当两个数字之间的差异大于给定数字例如两个时必须分割向量 Example data lt c 1 1 1 1 2 4 4
如何检查 keras 是否使用 GPU 版本的tensorflow？

当我运行 keras 脚本时我得到以下输出 Using TensorFlow backend 2017 06 14 17 40 44 621761 W tensorflow core platform cpu feature guard
Spring Security - 405请求方法“POST”不支持

我已经在我的项目中实现了 Spring Security 但是当我尝试登录时我收到状态 405 我已经添加了csrf中的令牌form 这是我发送用户名和密码时收到的错误 HTTP Status 405 Request method POS
为什么我使用 iteratee IO 的 Mapreduce 实现（现实世界的 haskell）也会失败并出现“打开文件过多”

我正在实现一个 haskell 程序它将文件的每一行与文件中的每一行进行比较哪些可以实施单线程如下 distance Int gt Int gt Int distance a b a b a b sumOfDistancesOnSmal
JFreeChart - 如何反转轴顺序

我正在创建 XYPlot 并且需要反转 y 轴上的顺序也就是说我需要较低的数字来使轴上的数字较高我将不胜感激任何关于如何做到这一点的提示我和你有同样的问题我找到了这个 ChartPanel getChart getXYPlot g
如何使用 OfType<> 过滤泛型类型的所有变体

我想过滤a中的对象List
为 Linux 打包专有软件

我正在做跨平台开发我想为 Linux 构建一个漂亮的独立的包我知道这不是通常的做法但应用程序需要将所有数据集中在一个位置因此我将其安装到 opt 中就像许多其他专有软件包一样我最终会提供 deb 和 rpm 包但目前只是
在knockout.js中设置组合的optionsText

我想在 optionsText 字段中组合两个返回值我认为这很简单但我显然错了我还使用了正常视图模型之外的选项字段的值这是原文
datagridview 不允许用户删除行

我有一个绑定到数据表的 datagridview 这些列不是自动生成的我是在代码中创建的我希望我的用户能够添加和删除行因此我有AllowUserToAddRows true AllowUserToDeleteRows true 问题是
将 getaddrinfo() 与 AI_PASSIVE 一起使用

The getaddrinfo 理论上该函数不仅允许客户端程序有效地找到正确的数据来创建给定主机的套接字而且还允许服务器绑定到正确的套接字 I just 了解到这一点并开始通过 Python 尝试它 from socket import
Welcome#index 中的 ExecJS::ProgramError TypeError: 对象不支持此属性或方法

我对 Ruby on Rails 完全陌生我费了很大的劲才在我的 Windows 8 机器上安装了该软件现在我只是跟随本指南创建一个示例 Hello World 示例当我尝试遵循部分中给出的步骤时4 3 设置应用程序主页我开始面临问
将 Apache 从 2.4.18 升级到 2.4.46 后，如何修复“(38)功能未实现：AH00141：无法初始化随机数生成器”？

我有一个运行系统包括 Ubuntu 16 04 Apache 2 4 18 PHP 7 3 和 7 4 PHP FPM PHP FastCGI MPM 事件我想升级到最新的 Apache 版本 2 4 46 2 ubuntu16 04
For 循环在字符串中搜索单词

我似乎找不到此方法中 for 循环所需的语法我正在寻找迭代字符串中的单词suit 编辑需要注意的一件事是 cardArray 是一个 ArrayList public String getSuit int card String sui
选择 PHP 缓存技术：输出缓存到文件与操作码缓存

我听说过两种 PHP 代码缓存技术当 PHP 脚本生成输出时它将其存储到本地文件中当再次调用该脚本时它会检查先前输出的文件是否存在如果为 true 则返回该文件的内容它主要是通过输出缓冲区来完成的像这样的事情被描述在thi
Android Compose：在图像上绘制透明圆圈

I have an image and I want to draw dark rectangle over it with a transparent circle so the result will be something like
UIStoryboard如何以编程方式替换约束？

我在故事板中放置了一个视图控制器并启用了自动布局并且正在寻找一种方法来更改约束以允许我的视图旋转为横向并重新排列屏幕上的按钮当我尝试下面的代码时我收到大约两打无法满足约束破坏约束的消息我无法真正解码有没有办法用我以编程方
Rust 如何处理隐藏变量？

我有很强的 C C 背景最近正在学习 Rust 对 Rust 如何处理隐藏变量感到困惑特别是我期望以下代码段运行没有问题因为guess在下一次将其作为字符串调用之前将其从字符串隐藏为整数read line 看了API文档我明白了
PHP 中规范 uuid 表示的 16 字节二进制形式

如何从 uuid 的字符串规范表示形式中获取 16 字节二进制形式 ex 1968ec4a 2a73 11df 9aca 00012e27a270 干杯马尔辛 bin pack h str replace guid pack
如何在 wsgi 中启动 pdftk 子进程？

我需要在 Django 中提供 Web 请求时启动 pdftk 进程并等待它完成我当前的 pdftk 代码如下所示 proc subprocess Popen usr bin pdftk tmp infile1 pdf tmp infi

如何在 wsgi 中启动 pdftk 子进程？

如何在 wsgi 中启动 pdftk 子进程？ 的相关文章

随机推荐

热门标签

如何在 wsgi 中启动 pdftk 子进程？的相关文章