将pdf文件与ghostscript结合，如何包含原始文件名？

2024-03-06

我有大约 250 个单页 pdf 文件，其名称如下：

file_1_100.pdf,
file_1_200.pdf, 
file_1_300.pdf, 
file_2_100.pdf, 
file_2_200.pdf, 
file_2_300.pdf, 
file_3_100.pdf, 
file_3_200.pdf, 
file_3_300.pdf
...etc

我使用以下命令将它们合并为一个 pdf 文件：

gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=finished.pdf file*pdf

它工作完美，以正确的顺序组合它们。但是，当我查看 finish.pdf 时，我想要一个参考来告诉我每个页面的原始文件名。

有没有人有什么建议？我可以添加引用文件或其他内容的页面名称吗？

将文件名放入许多 PDF 查看器可以显示的书签列表中相当容易。

这是通过 PostScript 使用“pdfmark”蒸馏器操作符完成的。例如，使用以下内容

gs -sDEVICE=pdfwrite -o finished.pdf control.ps

其中 control.ps 包含用于打印页面并输出书签 (/OUT) pdfmarks 的 PS 命令：

(examples/tiger.eps) run [ /Page 1 /Title (tiger.eps) /OUT pdfmark
(examples/colorcir.ps) run [ /Page 2 /Title (colorcir.ps) /OUT pdfmark

请注意，您还可以使用 PS 执行枚举来自动化整个过程：

/PN 1 def
(file*.pdf) {
  /FN exch def
  FN run
  [ /Page PN /Title FN /OUT pdfmark % do the file and bookmark it by filename
  /PN PN 1 add def % bump the page number
} 1000 string filenameforall

注意，未指定 filenameforall 枚举的顺序，因此您可能需要对列表进行排序使用 Ghostscript 扩展名 .sort ( array lt .sort lt ) 来控制顺序。

经过思考之后，我还意识到，如果输入文件有多于一页，则有一种更好的方法可以使用“PageCount”设备属性将书签设置为正确的页码。

[
  (file*.pdf) { dup length string copy } 1000 string filenameforall
] % create array of filenames
{ lt } .sort % sort in increasing alphabetic order
/PN 1 def
{ /FN exch def
  /PN currentpagedevice /PageCount get 1 add def % get current page count done (next is one greater)
  FN run [ /Page PN /Title FN /OUT pdfmark % do the file and bookmark it by filename
} forall

上面创建了一个字符串数组（将它们复制到唯一的字符串对象，因为 filenameforall 只是覆盖给定的字符串），然后对其进行排序，最后处理字符串数组使用 forall 运算符。通过使用 PageCount 设备属性来获取已生成的页面数，书签的页码 (PN) 将是正确的。我已将此代码段测试为“control.ps”。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pdf

Ghostscript

将pdf文件与ghostscript结合，如何包含原始文件名？的相关文章

将 pdf 图像转换为 jpg 图像的最快方法是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在尝试将多个 pdf 10k 转换为 jpg 图像并从中提取文本我目前正在使用pdf2imagepython 库但它相当慢有没有比这更
如何在Android中将图像文件转换为pdf文件

我正在尝试在 Android 应用程序中将图像文件 jpg 转换为 pdf 文件我用过itextpdf罐子和机器人文本罐都不适合我下面是使用时的代码itextpdf Document document new Document Str
我可以使用什么 C++ 库在 Windows 上将 PDF 转换为图像？

我正在开展一个需要分析图像的项目这些图像的主要来源是网络摄像头但最近我们被要求添加对上传文件和扫描仪的支持这在大多数情况下都很好只是他们希望我们能够使用 PDF 格式的文档我需要一个原始像素位图进行处理在 Mac 上我可以使用
如何让我的应用程序出现在应用程序选择器中？

我想宣传一下我的应用程序能够查看 pdf 文件这样当从文件管理器中选择 pdf 文件时它就会出现在应用程序选择器中这是我的意图过滤器的样子
在solr中获取pdf搜索结果的页码

我正在构建一个 Web 应用程序用户可以在其中搜索 pdf 文档并使用 pdf js 查看它们我想显示搜索结果其中包含找到搜索词的段落的简短片段以及用于在右侧页面打开文档的链接所以我需要的是每个搜索结果的页码和简短的文本片段我正在
如何使用PDFBOX确定文本的人工粗体样式、人工斜体样式和人工轮廓样式

我正在使用 PDFBox 来验证 pdf 文档检查 PDF 中存在的以下类型的文本有一定要求人工粗体样式文本人造斜体样式文本人工轮廓样式文本我在 PDFBOX api 列表中进行了搜索但找不到此类 api 任何人都可以帮助我并告
粘合（拼版）PDF 文档

我有几个 A4 PDF 文档我想将它们二合一粘合在一起成为 A3 格式的 PDF 文档所以我将从 2PDFs 中得到A4单面 PDFA3 我发现了出色的实用性PDF工具包 http www pdfhacks com pdftk 和
使用 ps2pdf (ghostscript) 创建正确的 PDF/X

我已经为此苦苦挣扎了几天所以我想我应该在这里寻求帮助基本上我尝试使用 ps2pdf 版本 9 10 创建正确的 PDF X 1 和 PDF X 3 文档是的我知道据说 ps2pdf 仅支持 PDF X 3 请参阅这个线程 http
使用什么来生成包含动态生成的条形码的 pdf 文档（Java）？

我的要求要求生成包含任意文本和条形码的 pdf 文档我有相关的question https stackoverflow com q 6625849 59470它解决了pdf生成部分但在这里我想知道如何在Java中将条形码合并到pdf中
在 ionic 中从 Base64 打开 pdf

因此我将 Jasper 报告转换为 pdf 然后在 REST 控制器中转换为 base64 我该如何将其传输到我的 ionic 3 应用程序我研究了 Ionic Native Document Viewer 但为了做到这一点我需要将文
使用 Pyqt4 从 URL 下载数千个 PDF

理想情况下我试图从给定网站下载数千个 PDF 然而由于某种原因它甚至无法下载 100 个 PDF 我不知道为什么这是代码 usr bin env python import time from pyPdf import PdfFil
无法在 Angular 10 中的“pdf-viewer”=>“ng2-pdf-viewer”中显示 blob url

我有一个 API 它将上传的文件作为 blob 返回当我尝试绑定时src如果使用 blob URL 则它不会显示任何内容但是当我尝试绑定直接 URL 时它可以显示 PDF 文件这是我下面给出的代码我的 TS 代码 downloa
使用 iTextSharp 5.3.3 和 USB 令牌签署 PDF

我是 iTextSharp 和 StackOverFlow 的新手我正在尝试使用外部 USB 令牌在 C 中签署 PDF 我尝试使用从互联网上挖掘的以下代码 Org BouncyCastle X509 X509CertificatePar
使用 Tabula 通过 Python 读取 pdf 时出现 Java 错误

我已经安装了 tabula 库用于使用 python 将 pdf 读取到 pandas 数据框中但是当我运行代码时 import tabula df tabula read pdf sample1 pdf pages 1 我得到了例外
LibreOffice 并行将 .docx 转换为 .pdf 效果不佳

我有很多 docx 文件需要转换为 pdf 将它们一一转换需要很长时间所以我编写了一个 python 脚本来并行转换它们 from subprocess import Popen import time import os os chdi
使用 PHP 将值插入可编辑 PDF，并保持可编辑状态

我有一个带有可编辑字段的 PDF 我希望将 HTML 表单中的值传递到此 PDF 中我尝试过使用 FPDF 并且它有效但是将值传递到 PDF 后 pdf 中的字段不再可编辑另一个缺点是在将值传递到 PDF 时我们必须为每个字段指定
使用 JavaScript 生成 PDF 文件

我正在尝试将 XML 数据从网页转换为 PDF 文件并且希望能够完全在 JavaScript 中完成此操作我需要能够绘制文本图像和简单的形状我希望能够完全在浏览器中完成此操作我刚刚写了一个名为jsPDF https github
如何将目录及其子目录中的所有 PDF 文件复制到一个位置？

如何全部复制PDF文件从目录及其子目录到单个目录实际上还有更多的文件并且深度有些任意假设四个目录的最大深度是公平的我想这些文件需要重命名如果a pdf例如位于多个目录中因为我会adding https ebooks stack
无法在jspdf中加载多个图像

我正在尝试加载动态生成的多个图像我想将这些图像转换为 PDF 格式 HTML 代码如下
如何在无头模式下使用 Libre Office Draw 从命令行创建 PDF/A？

LibreOffice Draw 允许您打开非 PDF A 文件并将其导出为 PDF A 1b 或 PDF A 2b 文件通过在 macOS 上调用命令行也可以实现相同的效果 Applications LibreOffice app Co

随机推荐

在create-react-app中添加git信息

在开发中我希望能够从网络上查看构建信息 git 提交哈希作者最后提交消息等我努力了使用child process执行git命令行并读取结果由于浏览器环境不起作用期间生成 buildInfo txt 文件npm build并从
Google App Engine - 请求在等待太长时间后被中止，无法尝试满足您的请求

我有时会收到此错误等待后请求也被中止很长时间尝试为您服务要求这很可能表明你已经达到了你的同时动态请求限制这几乎总是由于您的应用程序中的延迟过高请参见http code google com appengine docs q
外部调用UI按钮

回答结果可以在这里看到 http apitecture com dev cked index 2 html http apitecture com dev cked index 2 html 工作代码摘录 a color on click
无法推断此地图的类型

我一直在尝试定义类型TESTS打字稿中的对象如下但仍然无法弄清楚任何内容如果有人知道它的类型是什么并且向我解释一下因为我刚刚开始使用那将非常有帮助ts 这是我正在谈论的对象 const TESTS reminderEmail ne
OSError: [WinError 10013] 尝试以访问权限禁止的方式访问套接字

我正在尝试使用 Huey 作为跨平台任务队列我发现了https github com pjcunningham flask huey example https github com pjcunningham flask huey exa
Python 错误 - IDLE 的子进程未建立连接。 IDLE 无法启动或个人防火墙软件阻止连接

我是编程新手我决定先学习 Python 所以我安装了Python 最新版本3 4 我正在尝试打开Python IDLE GUI 模式所以当我打开时我收到消息 IDLE的子进程没有建立连接 IDLE无法启动或个人防火墙软件正在阻止连接
如何将 Spring AbstractRoutingDataSource 与动态数据源一起使用？

我正在使用 Spring Spring Data JPA Spring Security Primefaces 的项目我正在关注本教程 http spring io blog 2007 01 23 dynamic datasource r
Python：为控制台打印编写单元测试

功能foo打印到控制台我想测试控制台打印我怎样才能在Python中实现这一点需要测试这个函数没有 return 语句 def foo inStr print hi inStr 我的测试 def test foo cmdProcess
文本到 Div 底部

有什么方法可以将div的内容文本放到它的底部吗这里我准备了一个例子 http jsfiddle net JGuP7 http jsfiddle net JGuP7 这是示例层次结构 div class button Button Labe
如何通过在邮件内容中插入html来使用php发送邮件？ [复制]

这个问题在这里已经有答案了如何通过在邮件内容中插入html来使用php发送邮件我尝试在内部插入html代码 message 当我测试时显示错误像这样Parse error syntax error unexpected margin
用于解析属性中所有 IDREFS 的 XPath 查询（可能包含许多 ID）

我需要提出一个查询给出未售出商品类型的产品这意味着如果商品属于服装类型并且交易列表中没有出现服装商品我需要显示它这是我的 XML 文件对超级加拿大风格表示歉意
如何从字节创建 numpy ndarray？

我可以使用将 numpy ndarray 转换为字节myndarray tobytes 现在我怎样才能把它恢复到 ndarray 呢使用来自的示例 tobytes 方法文档 gt gt gt x np array 0 1 2 3 gt g
使用 getFieldValue() 保存多种表单中的数据

我尝试保存 2 个表单中的数据 Main and SubForm using getFieldValue 这里应该出现两个表单数据 const save gt console log myRef current getFieldValue
为什么使用片段，何时使用片段而不是活动？

在 Android API 11 中 Google 发布了一个新类名为Fragment 在视频中谷歌建议只要有可能 link1 https www youtube com watch v WGIU2JX1U5Y link2 https
时态数据库建模和标准化

时态数据库的日期应该存储在一张还是两张表中如果这不违反规范化 PERSON1 DATE11 DATE21 INFO11 INFO21 DEPRECATED PERSON2 DATE21 DATE22 INFO21 INFO22 CURRE
Watch OS 应用程序无法与 iOS 应用程序连接

我正在尝试将我的 Watch OS 应用程序与 iOS 应用程序连接并获取一些数据但当我尝试与 iOS 应用程序连接时出现以下错误 WC 28 WCSession activateSession block invoke 2 sessio
Java 摆动范围滑块 U.I

我需要一个带有两个旋钮的滑块代表一个范围我发现了这个漂亮的滑块here http blog limewire org p 340 然而他们创建了自己的用户界面它扩展了Java的基本滑块UI http java sun com j2s
随着批量大小的变化，学习率应该如何变化？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案当我增加减少 SGD 中使用的小批量的批量大小时我应该更改学习率吗如果是这样那又如何呢作为参考我和某人讨论过据说当batch
WPF 数据模板绑定

我发现在 WPF TabControl 中使用 ContentTemplate DataTemplate 时我的绑定将不再起作用我举了一个小例子来说明
将pdf文件与ghostscript结合，如何包含原始文件名？

我有大约 250 个单页 pdf 文件其名称如下 file 1 100 pdf file 1 200 pdf file 1 300 pdf file 2 100 pdf file 2 200 pdf file 2 300 pdf file

将pdf文件与ghostscript结合，如何包含原始文件名？

将pdf文件与ghostscript结合，如何包含原始文件名？ 的相关文章

随机推荐

热门标签

将pdf文件与ghostscript结合，如何包含原始文件名？的相关文章