如何获取PDF的书签并将书签添加到新的pdf中？

2024-02-21

我正在将一个 PDF 合并到其他 PDF，它工作正常，但最终 PDF 中缺少书签。

以下是PDF生成代码：

#- Create One Page PDF with some text
from reportlab.pdfgen import canvas as canx
c = canx.Canvas('transparent.pdf')
c.setStrokeColor((1, 0, 0))
transparentwhite = canx.Color(255, 255, 255, alpha = 0.0)
c.setFillColor(transparentwhite)
t = c.beginText()
t.setTextRenderMode(2)
c._code.append(t.getCode())
c.setFont('Helvetica', 48)
c.saveState()
c.translate(100, 100)
c.rotate(45)
c.drawCentredString(500, 100, 'DRAFT')
c.save()

以下是合并代码：

#- Merge PDF.
transparentbannerfile = open('transparent.pdf', 'rb')
testpagefile = open('NOID_body20160202T133650.pdf', 'rb')
outputfile = open('mergedtransparent.pdf', 'wb')
import PyPDF2 as pdf
readerbanner = pdf.PdfFileReader(transparentbannerfile)
readertestpages = pdf.PdfFileReader(testpagefile)
bannerpage = readerbanner.getPage(0)
writeroutput = pdf.PdfFileWriter()
for x in xrange(readertestpages.getNumPages()):
  pagex = readertestpages.getPage(x)
  pagex.mergePage(bannerpage)
  writeroutput.addPage(pagex)

writeroutput.write(outputfile)
outputfile.close()
transparentbannerfile.close()
testpagefile.close()

但书签丢失，元数据中也丢失标题。

什么是'bookmarkHorizontal', 'bookmarkHorizontalAbsolute', 'bookmarkPage'的方法canvas object?

同样的问题也在这里如何给PDF文件添加书签？ https://stackoverflow.com/questions/27041096/how-to-add-bookmarks-to-pdf-file

我可以从以下代码中获取标题：

from pyPdf import PdfFileReader
pdf_toread = PdfFileReader(open('NOID_body20160202T133650.pdf', "rb"))
pdf_info = pdf_toread.getDocumentInfo()
print pdf_info

将标题设置为新 PDFsetTitle method

#- Create One Page PDF with some text
from reportlab.pdfgen import canvas as canx
c = canx.Canvas('transparent.pdf')
c.setTitle("Test to set Title")

Or:

import PyPDF2 as pdf
writeroutput = pdf.PdfFileWriter()
writeroutput.addMetadata({'/Title': u'Print Page Sizes'})

BookMark

首先从输入pdf这些代码中获取书签如何获取书签的页码 https://stackoverflow.com/questions/8329748/how-to-get-bookmarks-page-number
以下代码将书签添加到新的 PDF：

transparentbannerfile = open('transparent.pdf', 'rb')
testpagefile = open('NOID_body20160202T133650.pdf', 'rb')
outputfile = open('mergedtransparent112.pdf', 'wb')
import PyPDF2 as pdf
from collections import OrderedDict
readerbanner = pdf.PdfFileReader(transparentbannerfile)
readertestpages = pdf.PdfFileReader(testpagefile)
bannerpage = readerbanner.getPage(0)
writeroutput = pdf.PdfFileWriter()
for x in xrange(readertestpages.getNumPages()):
    pagex = readertestpages.getPage(x)
    pagex.mergePage(bannerpage)
    writeroutput.addPage(pagex)

a = OrderedDict([(u'SIDDHARTHA', {'top': 750, 'left': 0, 'page': 1, 'title': u'SIDDHARTHA'}), (u'Chapter 01', {'top': 750, 'left': 0, 'page': 3, 'title': u'Chapter 01'}), (u'Chapter 02', {'top': 503, 'left': 0, 'page': 6, 'title': u'Chapter 02'}), (u'Chapter 03', {'top': 340, 'left': 0, 'page': 11, 'title': u'Chapter 03'}), (u'Chapter 04', {'top': 231, 'left': 0, 'page': 17, 'title': u'Chapter 04'}), (u'Chapter 05', {'top': 909, 'left': 0, 'page': 30, 'title': u'Chapter 05'}), (u'Chapter 06', {'top': 614, 'left': 0, 'page': 32, 'title': u'Chapter 06'}), (u'Chapter 07', {'top': 417, 'left': 0, 'page': 35, 'title': u'Chapter 07'}), (u'Chapter 08', {'top': 289, 'left': 0, 'page': 41, 'title': u'Chapter 08'})])
for i in a:
    writeroutput.addBookmark(i, a[i]["page"]-1, a[i])

writeroutput.write(outputfile)
outputfile.close()
transparentbannerfile.close()
testpagefile.close()

`

现在如何处理嵌套书签:)??

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pdf

reportlab

pypdf

如何获取PDF的书签并将书签添加到新的pdf中？的相关文章

使用 matplotlib 从“列表列表”绘制 3D 曲面

我已经搜索了一些虽然我可以找到许多有用的网格网格示例但没有一个清楚地表明我如何将列表列表中的数据转换为可接受的形式以适应我所讨论的各种方式当谈到 numpy matplotlib 以及我所看到的建议的术语和步骤顺序时我有点迷失我
Twisted 的 Deferred 和 JavaScript 中的 Promise 一样吗？

我开始在一个需要异步编程的项目中使用 Twisted 并且文档非常好所以我的问题是 Twisted 中的 Deferred 与 Javascript 中的 Promise 相同吗如果不是有什么区别你的问题的答案是Yes and No
如何以“正确”的方式处理带有空字节的 Python unicode 字符串？

Question PyWin32 似乎很乐意将 null 终止的 unicode 字符串作为返回值我想以正确的方式处理这些字符串假设我得到一个像这样的字符串 u C Users Guest MyFile asy x00 x00sy
python 中的并行处理

在 python 2 7 中进行并行处理的简单代码是什么我在网上找到的所有示例都很复杂并且包含不必要的代码我该如何做一个简单的强力整数分解程序在每个核心 4 上分解 1 个整数我真正的程序可能只需要2个核心并且需要共享信息我知
使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
Kivy - 有所有颜色名称的列表吗？

在 Kivy 中小部件 color属性允许输入其值作为字符串颜色名称也例如在 kv file Label color red 是否有所有可能的颜色名称的列表就在这里来自Kivy 的文档 https kivy org doc sta
Python - 来自 .进口

我第一次尝试图书馆我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些糟糕也许只是因为我不记得经常看到它尽管公平地说我还没有深入研究
删除 Django 1.7 中的应用程序（和关联的数据库表）

是否可以使用 Django 1 7 迁移来完全删除卸载应用程序及其所有跟踪主要是其所有数据库表如果没有在 Django 1 7 中执行此操作的适当方法是什么 python manage py migrate
Python 中的流式传输管道

我正在尝试使用 Python 将 vmstat 的输出转换为 CSV 文件因此我使用类似的方法转换为 CSV 并将日期和时间添加为列 vmstat 5 python myscript py gt gt vmstat log 我遇到的问题是
工作日重新订购 Pandas 系列

使用 Pandas 我提取了一个 CSV 文件然后创建了一系列数据来找出一周中哪几天崩溃最多 crashes by day bc DAY OF WEEK value counts 然后我将其绘制出来但当然它按照与该系列相同的排名顺序绘制
在 Django OAuth Toolkit 中安全创建新应用程序

如何将 IsAdminUser 权限添加到 Django OAuth Toolkit 中的 o applications 视图 REST FRAMEWORK DEFAULT PERMISSION CLASSES rest framework
结构差异 sudo() run('sudo 命令')

我想知道函数之间有什么区别sudo 和函数run sudo u user smth 文档上有 sudo 在所有运行方式上都是相同的除了它总是换行调用 sudo 程序中的给定命令以提供超级用户特权但有几次 sudo cmd 提示我输入
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo
将seaborn.palplot轴添加到现有图形中以可视化不同调色板

将seaborn人物添加到子图中是usually https seaborn pydata org examples cubehelix palette html创建图形时通过传递 ax 来完成例如 sns kdeplot x y cma
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
SocketIO + Flask 检测断开连接

我在这里有一个不同的问题但意识到它可以简化为如何检测客户端何时从页面断开连接关闭其页面或单击链接换句话说套接字连接关闭我想制作一个带有更新用户列表的聊天应用程序并且我在 Python 上使用 Flask 当用户连接时浏览器发
将上下文管理器的动态可迭代链接到单个 with 语句

我有一堆想要链接的上下文管理器第一眼看上去 contextlib nested看起来是一个合适的解决方案但是此方法在文档中被标记为已弃用该文档还指出最新的with声明直接允许这样做自 2 7 版起已弃用 with 语句现在支持此
查找总和为给定数字的值组合的函数

这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合但由于这个帖子已经有6年多了我发这
如何为不同操作系统/Python 版本编译 Python C/C++ 扩展？

我注意到一些成熟的Python库已经为大多数架构 Win32 Win amd64 MacOS 和Python版本提供了预编译版本针对不同环境交叉编译扩展的标准方法是什么葡萄酒虚拟机众包我们使用虚拟机和Hudson http hud

随机推荐

在 Apple 平台的 AArch64 汇编中，如何在一行中编写多个语句？

我正在将一些 Arm64 汇编语言移植到 M1 其中一些是由 C 预处理生成的其中单个 define宏生成多个以分号分隔的语句不幸的是在 M1 上汇编器将分号视为注释字符例如 define DEFUN NAME globl NAM
可选框架不起作用（CoreAudioKit 不在模拟器上）

为了让 MIDI 通过蓝牙工作我需要使用CoreAudioKit框架这工作完美但我无法在模拟器上编译使框架可选没有帮助错误是ld framework not found CoreAudioKit 我认为它应该按照the doc
Azure-Container-Service 中的安装卷不适用于 traefik.toml 和 /var/run/docker.sock

构建从 VSTS 到 Azure container service 的 CI CD 管道我在安装 traefik toml 和 docker sock 文件时遇到了问题部署使用 SSH 隧道创建文件夹 Deploy 并复制 docke
C# 有异步函数调用同步函数或同步函数调用异步函数

我正在编写一个 C Net 4 5 库用于执行常见的 sql 数据库操作备份恢复执行脚本等我希望每个操作都具有同步和异步函数因为控制台和 GUI 应用程序都将使用该库但我不想到处重复代码所以在我看来我有两个选择编写在同步
使用 insertWithOnConflict 进行更新或插入

我需要插入或更新我找到了 SQLiteDatabase 的 insertWithOnConflict 方法但我不知道它如何检查该条目是否已存在理论上我需要一个 Where 参数来检查某个 ID 是否存在如果存在它应该替换所有其他
.R中的第一个函数

我不明白 R 中 First 函数的意义我的原因是 Rprofile 中的任何代码都将在 R 启动时被获取并执行 this First lt function library devtools and this library devto
WordPress：如何按 ACF 自定义字段对内容进行排序？

通过使用高级自定义字段插件我创建了一个包含 6 种成员资格类型的选择下拉列表我使用此自定义字段的所有列表都被分配为 6 个字段之一我想通过以下方式显示所有列表终极加号最终的专业的商业的商业 Free 按照这个特定的顺序那些支
将 JavaScript 变量发送到 PHP 变量 [重复]

这个问题在这里已经有答案了首先我认为我必须将 JavaScript 转换为 PHP 但后来我发现我不能因为服务器和客户端执行所以现在我只想发送一个变量到 PHP 变量当我点击一个按钮时 JavaScript 中的该函数就会执行现
Java 和 .Net 正则表达式

Java 和 Net Framework 正则表达式模式之间的区别我正在尝试转换我的 Net Framework 但模式无效谁能指出正则表达式模式的主要区别例如我们如何命名java中的分组结构等等有很多差异总结在这里 http ww
比较 C# 中的双精度值

I ve a double变量称为x 在代码中 x被赋值为0 1我在 if 语句中检查它比较x and 0 1 if x 0 1 不幸的是它没有进入if陈述我应该使用Double or double 这背后的原因是什么您能为此建议一个解
Selenium - 无响应脚本错误 (Firefox)

这个问题以前曾被问过但给出的答案似乎对我不起作用问题是当使用 Selenium 打开页面时我会收到许多无响应脚本弹出窗口引用不同的脚本当我使用不带 Selenium 的 Firefox 打开页面时没有出现任何错误另外奇
我可以通过编程方式设置 Mercurial 配置选项吗？

我正在寻找一种设置方法 hgrc配置项而无需实际编辑文本文件我正在尝试标准化设置hgrc跨多个开发人员我想要一个像这样的命令 hg config ui username foo 但这也将该配置更改保存到hgrc file 看起来这应该
通过 javascript 添加的输入字段不在 PHP $_POST 变量中。如何解决这个问题？

我在 html 表中有一个表单我通过 jquery 动态地将输入字段添加到表单中当我在提交表单时进行 var dump 时 POST 数组没有添加的字段为什么会发生这种情况这是我的 js 的样子 add more del areas
n 个集合的所有组合的交集

我需要帮助找到一种有效的算法来解决这个问题 Given n未排序的整数集找到所有可能的组合n以及它们的交集例如 Input n 3 Set 1 1 10 6 11 14 3 Set 2 3 7 11 9 5 Set 3 11 6 9 1
Protractor - 框架中的错误处理

我们如何处理基于 Protractor Cucumber 的框架中的错误有断言失败这是真正的失败并且 javascript 代码中存在错误例如未找到元素数组为空未定义的内容等我希望以优雅的方式处理后者目前量角器测试因上述错
限制批处理脚本中生成的进程数量

我遇到的情况与中描述的情况非常相似这个问题 https stackoverflow com questions 17236456 limiting the number of subshells spawned 但是是批量的不是外壳我制
如何使用java解决selenium webdriver中的超时错误？

My Html
macOS 和 XCode 中开发的辅助权限

有没有办法在开发过程中默认为我在 XCode 中开发的应用程序提供可访问权限我的想法是我可以按下运行键并测试新代码而无需跳过设置中的麻烦对于部署来说显然这是行不通的但是对于开发来说有没有办法将应用程序列入白名单 EDIT 这是我发
在 Rails 3 中过滤 has_many :through 关系中的子对象

问候我有一个应用程序其中Companies and Users需要通过某种方式彼此归属CompanyMembership模型其中包含有关成员资格的额外信息具体来说用户是否是公司的管理员通过布尔值admin 代码的简单版本 cla
如何获取PDF的书签并将书签添加到新的pdf中？

我正在将一个 PDF 合并到其他 PDF 它工作正常但最终 PDF 中缺少书签以下是PDF生成代码 Create One Page PDF with some text from reportlab pdfgen import canv

如何获取PDF的书签并将书签添加到新的pdf中？

`

如何获取PDF的书签并将书签添加到新的pdf中？ 的相关文章

随机推荐

热门标签

如何获取PDF的书签并将书签添加到新的pdf中？的相关文章