用python将多页pdf文件分割成多个pdf文件?

2023-12-05

我想获取一个多页 pdf 文件并为每页创建单独的 pdf 文件。

我已经下载了报告实验室并浏览了文档,但它似乎旨在生成 pdf。我还没有看到任何有关处理 PDF 文件本身的内容。

有没有一种简单的方法可以在 python 中做到这一点?


from PyPDF2 import PdfWriter, PdfReader

inputpdf = PdfReader(open("document.pdf", "rb"))

for i in range(len(inputpdf.pages)):
    output = PdfWriter()
    output.add_page(inputpdf.pages[i])
    with open("document-page%s.pdf" % i, "wb") as outputStream:
        output.write(outputStream)

etc.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用python将多页pdf文件分割成多个pdf文件? 的相关文章

  • 如何使用 cython 编译扩展?

    我正在尝试从示例页面编译一个简单的 cython 扩展here http docs cython org src userguide tutorial html在我安装了 Python 2 6 64 位版本的 Windows 7 64 位计
  • Tensorflow 可变图像输入大小(自动编码器、放大......)

    Edit WARNING不建议使用不同图像大小的图像 因为张量需要具有相同的大小才能实现并行化 我一直在寻找解决方案 了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而 由于每个图像的大小不同 我无法
  • Python 3 __getattribute__ 与点访问行为

    我读了一些关于 python 的对象属性查找的内容 这里 https blog ionelmc ro 2015 02 09 understanding python metaclasses object attribute lookup h
  • 如何从 PyCharm 项目中获取我的“exe”[重复]

    这个问题在这里已经有答案了 通过 PyCharm 在 Python 上编写一些项目 我想从中获取一个exe文件 我尝试过 另存为 gt XXX exe 但是 当我尝试执行它时出现错误 此类操作系统不支持该文件 附注 我有win7 x64 它
  • 可以在 TensorFlow 中使用排名相关作为成本函数吗?

    我正在处理偶尔充满异常值的极其嘈杂的数据 因此我主要依靠相关性来衡量我的神经网络的准确性 是否可以明确使用诸如等级相关性 斯皮尔曼相关系数 之类的东西作为我的成本函数 到目前为止 我主要依赖 MSE 作为相关性的代理 我现在面临三个主要障碍
  • 优化 Keras 以使用所有可用的 CPU 资源

    好吧 我真的不知道我在说什么 所以请耐心听我说 我正在使用 Theano 后端运行 Keras 以在 MNIST 图像上运行基本的神经网络 目前只是一个教程 过去 我一直使用我的旧 HP 笔记本电脑 因为我有 Windows 和 Ubunt
  • PIL Image.size 返回相反的宽度/高度

    使用PIL确定图像的宽度和高度 在特定图像上 幸运的是只有这一个 但这很麻烦 从 image size 返回的宽度 高度是相反的 图片 http storage googleapis com cookila 533ebf752b9d1f7c
  • 如何从 Dockerfile 安装 Python 3.7 和 Pip

    我正在尝试构建基于 Ubuntu 18 04 的自定义 Docker 映像 Ubuntu 预装了 Python 3 6 但我想 1 安装 Python 3 7 2 将其设置为默认 Python 版本 这样就可以使用python代替pytho
  • “char”/“character”类型的类型提示

    char 或 character 没有内置的原始类型 因此显然必须使用长度为 1 的字符串 但是为了暗示这一点并暗示它应该被视为一个字符 如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
  • Python Kivy - 在本机网络浏览器中打开 url 的应用程序

    我尝试制作一个简单的应用程序 在单击 Screen One 上的按钮后 在 Kivy 中打开一个网页 我使用了这个主题 Python 在应用程序中直接显示网络浏览器 iframe https stackoverflow com questi
  • 在可编辑的QSqlQueryModel中实现setEditStrategy

    这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里 我们创建了 QSqlQueryModel 的可
  • 为什么我用 beautifulSoup 刮的时候有桌子,但没有 pandas

    尝试抓取条目页面转换为制表符分隔格式 主要拉出序列和 UniProt 登录号 当我跑步时 url www signalpeptide de index php sess m listspdb bacteria s details id 10
  • Django 在选择列表更改时创建毫无意义的迁移

    我正在尝试使用可调用创建一个带有选择字段的模型 以便 Django 在选择列表更改时不会创建迁移 如中所述this https stackoverflow com questions 31788450 stop django from cr
  • Airflow Python 单元测试?

    我想为我们的 DAG 添加一些单元测试 但找不到任何单元测试 有 DAG 单元测试框架吗 有一个端到端的测试框架存在 但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
  • Python 3.2 中 **kwargs 和 dict 有什么区别?

    看起来Python的很多方面都只是功能的重复 除了我在 Python 中的 kwargs 和 dict 中看到的冗余之外 还有什么区别吗 参数解包存在差异 许多人使用kwargs 并通过dict作为论据之一 使用参数解包 Prepare f
  • 如何在sphinx中启用数学?

    我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
  • 检查字符串是否只有字母和空格 - Python

    试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe
  • 异步和协程与任务队列

    我一直在阅读有关 python 3 中的 asyncio 模块的内容 以及更广泛地了解 python 中的协程的内容 但我不明白是什么让 asyncio 成为如此出色的工具 我的感觉是 你可以用协程做的所有事情 通过使用基于多处理模块 例如
  • 使用 Python 生成类似于 Messenger 或 kik 代码的圆形二维码

    我可以使用 Python 生成圆形 QR 码 就像 Facebook Messenger 或 kik 使用的那样吗 我访问了很多网站 但找不到这种类型的二维码 默认情况下 Python 生成方形 QR 码 但在我的项目中我想要圆形 QR 码
  • Django South - 将 null=True 字段转换为 null=False 字段

    我的问题是 转变的最佳做法是什么null True场变成null False使用 Django South 的字段 具体来说 我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

  • 为什么C++中的字符串通常以'\0'结尾?

    在许多代码示例中 人们通常使用 0 创建一个新的 char 数组后 如下所示 string s JustAString char array new char s size 1 strncpy array s c str s size ar
  • TypeScript 中“=>”的含义是什么? (胖箭)

    我刚刚开始学习 TypeScript 我看到有很多代码使用这个语法 gt 我通过阅读做了一些研究TypeScript 1 6 版规范和一些谷歌搜索 我还是无法理解其含义 gt 对我来说 这感觉就像一个pointer在C 中 但我无法确认 如
  • Java 将 XML 解组为动态对象

    我正在寻找从 XML 定义创建和加载 JAVA 对象的最佳工具 方法 我已经退房了JAXB 看起来不错 但没有找到一种方法来处理属性是动态的或不时更改的实体 因此希望有类似自动处理实体的方法 而不需要将对象转换为预定义实体对象 存在这样的东
  • 如何使用ivy发布原生库?

    对于 Java 库项目 要发布的工件非常简单 因为输出是单个 jar 文件 但是 我还有一个包含以下内容的项目要发布 MyLib jar armeabi libStuff so armeabi v7a libStuff so mips li
  • 在ajax调用中访问函数外部的变量时出现问题

    getJSON http 192 168 1 9 8983 solr db select wt json start 0 rows 100 q query json wrf function result each result respo
  • 在java中保存对话框的数据

    if e getActionCommand equals save to file System out println save is pressed StringBuffer fileContent new StringBuffer T
  • 为什么导出/导入默认 ES 模块属性比命名模块属性更快?

    我正在阅读 Material UI 文档 它指出 请注意 在上面的示例中 我们使用了 import RaisedButton from material ui RaisedButton 代替import RaisedButton from
  • jQuery $.post() + IE8

  • 如何卸载RVM? [复制]

    这个问题在这里已经有答案了 可能的重复 如何从我的系统中删除rvm ruby版本管理器 如何在 Ubuntu 9 10 上卸载 或重新安装 RVM 我搞乱了当前的安装 这很容易 只需执行以下操作 rvm implode or rm rf r
  • Pandas Dataframe,当列不相等时连接两个dt

    假设我有两个形状相同的数据表 即 N 行和 2 列 它们具有相同的列名称 一 二 将第一个表称为 左 然后将第二个表称为 右 如何返回新的数据表FROM表 左 当 一 列中两个表的值分别为不等于 EX Table Left One Two
  • HTML 标签和元素有什么区别?

    我注意到大多数人都使用这些词HTML 标签 and HTML 元素可以互换 但它们之间有什么区别呢 我的看法是 标签位于源代码中 元素是 DOM 中 由浏览器 处理的标签 我错了吗 HTML 标签只是打开或关闭实体 例如 p and p 称
  • Firebase addValueEventListener 未触发

    上周左右 我在从 Firebase 数据库检索数据时遇到了麻烦 我在 StackOverflow 和 google 上搜索了这个问题的答案 要么我不理解所提供的解决方案 要么它们根本不适合我 一切都被成功调用 直到我到达 valueEven
  • 从 HTTP 响应中获取 JSON 对象

    我想得到一个JSON从 Http 对象获取响应 这是我当前的 Http get 代码 protected String doInBackground String params HttpClient client new DefaultHt
  • 我们如何使用 asp.net、webservice 和 sql 数据库集成 jQuery 自动完成?

    我正在尝试实现 jQuery Autocomplete 和 ASP NET 给出的代码 但无法集成它 因为您正在使用亚音速来查询数据库 那么你能告诉我如何使用C 查询sql数据库并将查询结果从asp net中的Web服务绑定到插件吗 这是一
  • 动态选择 TableLayout 中的 tableRow

    我正在动态创建一个包含许多 TableRows 的 Tablelayout 例如 for int i 0 i
  • Spring 4 中的 DeferredResult 支持 Servlet 3.1 (Read|Write)Listener 吗?

    我正在读杰威文章关于 Spring 对 Servlet 的异步支持 有趣的部分是 如果您的服务预计会接收大量请求或响应主体 特别是如果客户端写入或读取速度较慢 那么您将受益于使用 Servlet 3 1 中引入的非阻塞 IO 功能 如前所述
  • 删除 R 矩阵中所有数据均为 NA 的行[重复]

    这个问题在这里已经有答案了 可能的重复 在 R 中删除数据文件的空行 如何从矩阵或数据框中删除行all该行中的元素是否为 NA 所以要从中得到 1 2 3 1 1 6 11 2 NA NA NA 3 3 8 13 4 4 NA NA 5 5
  • 为什么我不能使用 HttpContext 或 HttpCookie? (ASP.NET核心1.0)

    为什么我不能使用HttpContext or HttpCookie 有什么特殊用途吗 我的实际使用情况 using System using System Collections Generic using System Linq usin
  • 元描述/标签不起作用

    我有一个非常奇怪的问题 元标记之前在我的主页上工作 但现在由于某种原因不再工作了 它在谷歌中没有正确显示标题 也没有我正在寻找的描述 我感觉元标记以某种方式被阻止了 我所做的唯一一件大事就是对网站进行 gzip 压缩 但我不确定这就是问题所
  • 用python将多页pdf文件分割成多个pdf文件?

    我想获取一个多页 pdf 文件并为每页创建单独的 pdf 文件 我已经下载了报告实验室并浏览了文档 但它似乎旨在生成 pdf 我还没有看到任何有关处理 PDF 文件本身的内容 有没有一种简单的方法可以在 python 中做到这一点 from