使用数字排序合并 pdf 文件

2024-04-03

我正在尝试编写一个 bash 脚本,将目录中的所有 pdf 文件合并到一个 pdf 文件中。命令pdfunite *.pdf output.pdf成功实现了这一点,但它按常规顺序合并输入文档:

1.pdf
10.pdf
11.pdf
2.pdf
3.pdf
4.pdf
5.pdf
6.pdf
7.pdf
8.pdf
9.pdf

虽然我希望按数字顺序合并文档:

1.pdf
2.pdf
3.pdf
4.pdf
5.pdf
6.pdf
7.pdf
8.pdf
9.pdf
10.pdf
11.pdf

我猜是一个命令混合ls -v or sort -n and pdfunite可以解决问题,但我不知道如何将它们结合起来。 关于如何合并 pdf 文件的任何想法用数字排序?


您可以使用嵌入命令的结果$(), 所以你可以执行以下操作

$ pdfunite $(ls -v *.pdf) output.pdf

or

$ pdfunite $(ls *.pdf | sort -n) output.pdf

但是,请注意,当文件名包含特殊字符(例如空格)时,这不起作用。

在这种情况下,您可以执行以下操作:

ls -v *.txt | bash -c 'IFS=$'"'"'\n'"'"' read -d "" -ra x;pdfunite "${x[@]}" output.pdf'

虽然看起来有点复杂,但它只是组合

  • Bash:将制表符分隔的文件行读入数组 https://stackoverflow.com/questions/9736202/bash-read-file-line-into-array
  • 构建包含空格的参数列表 https://stackoverflow.com/questions/411495/build-argument-lists-containing-whitespace
  • 如何转义单引号字符串中的单引号? https://stackoverflow.com/questions/1250079/escaping-single-quotes-within-single-quoted-strings

请注意,您不能使用xargs since pdfunite需要输入 pdf 作为参数的中间。 我避免使用readarray因为旧的 bash 版本不支持它,但你可以使用它来代替IFS=.. read -ra ..如果你有更新的bash.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用数字排序合并 pdf 文件 的相关文章

  • Linux命令列出所有可用命令和别名

    是否有一个 Linux 命令可以列出该终端会话的所有可用命令和别名 就好像您输入 a 并按下 Tab 键一样 但针对的是字母表中的每个字母 或者运行 别名 但也返回命令 为什么 我想运行以下命令并查看命令是否可用 ListAllComman
  • 无关的库链接

    我有一个可能有点愚蠢的问题 因为我很确定我可能已经知道答案了 假设你有静态库A 动态共享库B和你的linux下的程序C 假设库 A 调用库 B 中的函数 并且您的程序调用库 A 中的函数 现在假设 C 在 A 中调用的所有函数都不使用 B
  • 进程名称长度的最大允许限制是多少?

    进程名称允许的最大长度是多少 我正在读取进程名称 proc pid stat文件 我想知道我需要的最大缓冲区 我很确定有一个可配置的限制 但就是找不到它在哪里 根据man 2 prctl http man7 org linux man pa
  • Grails 渲染 PDF 文件

    我正在尝试在网页中呈现 PDF 文件 但使用以下语法时 我得到了一个奇怪的字符组合 render file new File path to file pdf fileName myPdfFile pdf 有谁知道除了上面的行之外我还需要添
  • BASH 脚本编译多个 C++ 文件 - OpenCV

    请参见在C 和OpenCV中调用其他文件中的函数 https stackoverflow com questions 24442836 call functions in other files in c and opencv 对于最初的问
  • 对 Python 中的嵌套字典进行排序

    我有以下字典 var a Black grams 1906 price 2 05 Blue grams 9526 price 22 88 Gold grams 194 price 8 24 Magenta grams 6035 price
  • Linux 上的 Python 3.6 tkinter 窗口图标错误

    我正在从 Python GUI 编程手册 学习 Python GUI 某项任务要求我通过将以下代码添加到我的配方中来更改窗口图标 Change the main windows icon win iconbitmap r C Python3
  • 如何从 Linux 命令行获取视频文件的分辨率(宽度和高度)?

    我一直在挖掘 mplayer mencoder 和 ffmpeg 文档 但我似乎无法想出anything 我对输出格式不是特别挑剔 因为我可以使用正则表达式将其拉出来 我只是似乎无法首先获取数据 Use ffprobe https ffmp
  • python:numpy 运行脚本两次

    当我将 numpy 导入到 python 脚本中时 该脚本会执行两次 有人可以告诉我如何阻止这种情况 因为我的脚本中的所有内容都需要两倍的时间 这是一个例子 usr bin python2 from numpy import print t
  • 无法仅在控制台中启动 androidstudio

    你好 我的问题是下一个 我下载了Android Studio如果我去 路径 android studio bin 我执行studio sh 我收到以下错误 No JDK found Please validate either STUDIO
  • Scrapy FakeUserAgentError:获取浏览器时发生错误

    我使用 Scrapy FakeUserAgent 并在我的 Linux 服务器上不断收到此错误 Traceback most recent call last File usr local lib64 python2 7 site pack
  • 将 JSON 数组转换为 bash 数组并保留空格

    我想将 JSON 文件转换为 bash 字符串数组 稍后我可以对其进行迭代 我的JSON结构如下 USERID TMCCP CREATED DATE 31 01 2020 17 52 USERID TMCCP CREATED DATE 31
  • 如何成功使用RDAP协议代替whois

    我对新的 RDAP 协议有点困惑 也不知道何时进一步追求它有意义 在我看来 每个人都同意它是 whois 的继承者 但他们的数据库似乎是空的 在 ubuntu 上我尝试了 rdapper nicinfo 甚至他们的 RESTful API
  • 以编程方式识别 PDF 文件中的扫描文本 [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有一个 PDF 文件 其中包含我们需要导入数据库的数据 这些文件似乎是打印的字母数字文本的 pdf
  • 如何让 clangd 转向 c++20

    当没有其他信息时 如何让 clangd 回退到 c 20 例如 在第一次构建之前 cmake 可以生成一个 这是在带有最新 LLVM 的 Arch Linux 上 这是通过 Emacs LSP 运行的 但这应该没有什么区别 你可以加 Com
  • gentoo crontab:为什么这个简单的 crontab 不起作用?

    我使用 GENTOO 发行版 crontab e 35 12 root php5 home www cron php 当我手动运行时 php5 php5 home www cron php 这有效 它向我发送了一封电子邮件 然后我检查日期
  • Zend 框架 PDF 问题

    又是我 伙计们 我有一个小问题 Create new PDF pdf new Zend Pdf Add new page to the document page pdf gt newPage Zend Pdf Page SIZE A4 p
  • 我的 unix 脚本出了什么问题

    bin bash while echo n Player s name read name name ZZZ do searchresult grep name playername if searchresult 0 then echo
  • 停止服务时单元陷入故障状态(状态=143)[关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 这是我的问题 我有 CentOS 和 java 进程在上面运行 Java进程是通过启动 停止脚本来操作的 它也创建了 java 实例的 p
  • 为什么在 Linux 上字符串文字的内存地址与其他字符串文字的内存地址如此不同?

    我注意到字符串文字在内存中的地址与其他常量和变量 Linux 操作系统 非常不同 它们有许多前导零 未打印 Example const char h Hi int i 1 printf p n void h printf p n void

随机推荐

  • 如何在 C# 中截断列表?

    我知道在 python 中你可以做类似的事情myList 1 20 但是C 中有类似的东西吗 var itemsOneThroughTwenty myList Take 20 var itemsFiveThroughTwenty myLis
  • 无法将 8 位地址移至 16 位寄存器

    我正在尝试分配变量来注册 代码如下 ORG 100h var1 DB 10 var2 DB 20 MOV BX var1 error operands do not match 16 bit register and 8 bit addre
  • 查询合并连续时间记录

    我有一个这样的表 id START DATE end date 1 01 01 2011 01 10 2011 2 01 11 2011 01 20 2011 3 01 25 2011 02 01 2011 4 02 10 2011 02
  • 隐藏打印文本

    我这里有一个打印页 如何隐藏底部显示 关闭窗口 和 打印页面 的链接 使其不被打印在打印页面上 你可以使用CSS media 规则 http www w3 org TR CSS21 media html为了这 首先 添加一个类noprint
  • 网页抓取 - 如何通过 Angular.js 访问在 JavaScript 中呈现的内容?

    我正在尝试从公共网站抓取数据asx com au http www asx com au 这一页http www asx com au asx research company do ACB details http www asx com
  • 如何使用 Ruby 和 MongoId 正确保存时区?

    如果这是一个菜鸟问题 请原谅 我有一个应用程序 用户可以在其个人资料中设置自己的时区 当有人添加阵容 应用程序特定术语 时 我会执行以下操作 time ActiveSupport TimeZone new user timezone par
  • 如何运行媒体流

    我创建了一个网络摄像头流 navigator getUserMedia video true function stream videoTag src window URL createObjectURL stream videoTag p
  • 为什么浏览器不支持 PUT 和 DELETE 请求?何时支持?

    我最近看到许多框架决定在表单提交 而不是ajax 中 伪造 PUT 和 DELETE 请求 就像 Ruby on Rails 一样 他们似乎在等待浏览器迎头赶上 他们的等待是徒劳的吗 这是否会在任何地方实施 Browsers支持PUT an
  • 如何在 Python 中格式化具有可变位数的数字?

    假设我想显示数字 123 并在前面添加可变数量的填充零 例如 如果我想以 5 位数字显示它 我会digits 5给我 00123 如果我想以 6 位数字显示它 我会digits 6 giving 000123 我将如何在 Python 中做
  • 如何将调试器附加到 IIS 而不是 ASP.NET 开发服务器?

    我有一个 ASP NET 网站 当我按 F5 时 它会自动附加到 ASP NET 开发服务器 当我按 F5 时 如何附加到 IIS 工作进程 调试 gt 附加到进程 选择aspnet wp exe从列表中进行处理 如果你正在跑步IIS gt
  • 如何在.NET 中获取当前窗口句柄计数和窗口句柄限制?

    我想在C 中获取当前窗口句柄数和系统范围的窗口句柄限制 我该怎么办 如果你读过 Raymond Chen 的帖子 你可能会像我一样觉得它很烦人 您只是 可能做错了什么 因为您正在做 Windows 无法完成的事情 在我的应用程序中 当用户第
  • 垃圾收集器优先和 JMap EOF 错误

    我们正在研究客户的生产服务器堆以检测和解决内存泄漏 为此 我们定期使用 jmap 来收集必要的信息 但上周我们无法进行转储 因为它触发了 EOF 错误并关闭了 Tomcat 实例 我在互联网上搜索但找不到有关此错误的任何具体信息 我们发现它
  • Raphaeljs 在 IE 中将所有文本呈现为斜体

    我在用着拉斐尔 JS http raphaeljs com index html用于直观地表示一些数据 底层技术是 SVG 所以显然在 IE 中并不总是能很好地工作 但是该库在渲染有用的东西方面做得相对不错 尽管它通常看起来很差 无论如何
  • MERGE 语句的语法错误

    我正在尝试在 Go 中执行 MERGE 语句 query MERGE staged ON email 1 WHEN NOT MATCHED THEN INSERT email secret passwd ts newAcct VALUES
  • HTTP 服务的反应式缓存

    我正在使用 RsJS 5 5 0 1 在 Angular 2 中进行缓存 它运行良好 缓存功能的核心是 const observable Observable defer gt actualFn do gt this console log
  • Antlr4中有哪些加速解析的方法?

    我对Antlr4的性能有些怀疑 我目前正在使用 Python 和 Antlr4 与 Java 相比 它非常慢 使用 Antlr4 IntelliJ 插件验证 由于我需要使用更大的代码进行解析 因此我计划切换到 Antlr 最快的语言 例如
  • R中runif和sample的区别?

    他们使用的概率分布是什么 我知道 runif 给出小数 sample 给出整数 但我感兴趣的是 sample 是否也使用 均匀概率分布 考虑以下代码和输出 gt set seed 1 gt round runif 10 1 100 1 27
  • java.util.ConcurrentModificationException - ArrayList

    开始编辑请向下滚动查看更新的代码编辑结束 我已经在谷歌上搜索并搜索了为什么会发生这个异常 我知道它是由一个对象正在读取列表而同时从列表中删除了一个项目引起的 我已经根据我发现的建议更改了我的代码 但时不时我仍然会遇到此异常 并且它使我的应用
  • 整型的 std::isnan 和 std::isinf 重载

    Cppreference 提到了重载std isnan https en cppreference com w cpp numeric math isnan and std isinf https en cppreference com w
  • 使用数字排序合并 pdf 文件

    我正在尝试编写一个 bash 脚本 将目录中的所有 pdf 文件合并到一个 pdf 文件中 命令pdfunite pdf output pdf成功实现了这一点 但它按常规顺序合并输入文档 1 pdf 10 pdf 11 pdf 2 pdf