Python实现PDF合并工具(含源码)

2023-11-20

在工作中，每个月都会要遇到报账的情况，在现如今很多都是使用电子发票，获得的电子发票很多都是PDF格式，偶尔也有图片格式的。而且还是一张发票一个pdf文档，在打印贴票时，就需要一个文档一个文档的打开打印，十分的不便捷。

当然也可以使用某某PDF的编辑工具，把文档合并成一个文档。找了好几个工具不是有广告，就是要收费(有钱人，请飘过)。操，求人不如求己，自己搞一个。

1.选择文件夹

点击选择文件夹后，选择文件，文件夹选择后，按钮变为合并功能

    def btn_click(self, event):
        id = event.GetId()
        if id == 5:
            btn_lab = self.btn.GetLabelText()
            if btn_lab == '选择':
                dlg = wx.DirDialog(self, u"选择文件夹", style=wx.DD_DEFAULT_STYLE)
                if dlg.ShowModal() == wx.ID_OK:
                    self.folder_path = dlg.GetPath()  # 文件夹路径
                dlg.Destroy()
                self.txt.SetLabelText("选择路径：" + self.folder_path)
                self.btn.SetLabelText('合并')
            else:
                self.txt.SetLabelText('合并开始...')
                self.pdf_merge()
                self.txt.SetLabelText('合并完成：' + os.path.join(self.folder_path, 'pdf_merge.pdf'))
                self.btn.SetLabelText('选择')

2.找到所有的pdf文件

    def pdf_file_list(self):
        """
        获取文件夹中所有的.pdf类型的文件路径,包含子文件夹
        :return:
        """
        # 判断文件夹路径是否存在
        assert os.path.exists(self.folder_path), 'The folder path does not exist'
        pdf_paths = list()
        for root, dirs, files in os.walk(self.folder_path):
            for file in files:
                if file.endswith('.pdf'):
                    pdf_paths.append(os.path.join(root, file))
        return pdf_paths

3.合并文件并输出

    def pdf_merge(self, merge_name='pdf_merge.pdf'):
        """

        :param merge_name: 合并后的文件名
        :return:
        """
        print('PDF合并开始...')
        pdf_lst = self.pdf_file_list()
        file_merger = PdfFileMerger()
        for pdf in pdf_lst:
            # 合并pdf文件
            file_merger.append(pdf)

        # 合并后的文件导出
        file_merger.write(os.path.join(self.folder_path, merge_name))
        print('PDF合并完成')

4. 附完整代码

import wx
import os
from PyPDF2 import PdfFileMerger


class PDFGuiFrame(wx.Frame):
    """
    @描述：PDF合并工具
    @作者: MAX
    """

    def __init__(self, folderPath='./'):
        self.folder_path = folderPath
        super().__init__(None, title='PDF合并工具', size=(400, 100))
        self.Center()
        # 创建一个面板
        panel = wx.Panel(parent=self)
        # 面板中添加一个文本控件
        self.txt = wx.StaticText(parent=panel, label="默认路径：" + self.folder_path)
        self.btn = wx.Button(parent=panel, label='选择', id=5, pos=(150, 20))
        self.Bind(wx.EVT_BUTTON, self.btn_click, None, id=5)

    def btn_click(self, event):
        id = event.GetId()
        if id == 5:
            btn_lab = self.btn.GetLabelText()
            if btn_lab == '选择':
                dlg = wx.DirDialog(self, u"选择文件夹", style=wx.DD_DEFAULT_STYLE)
                if dlg.ShowModal() == wx.ID_OK:
                    self.folder_path = dlg.GetPath()  # 文件夹路径
                dlg.Destroy()
                self.txt.SetLabelText("选择路径：" + self.folder_path)
                self.btn.SetLabelText('合并')
            else:
                self.txt.SetLabelText('合并开始...')
                self.pdf_merge()
                self.txt.SetLabelText('合并完成：' + os.path.join(self.folder_path, 'pdf_merge.pdf'))
                self.btn.SetLabelText('选择')

    def pdf_file_list(self):
        """
        获取文件夹中所有的.pdf类型的文件路径,包含子文件夹
        :return:
        """
        # 判断文件夹路径是否存在
        assert os.path.exists(self.folder_path), 'The folder path does not exist'
        pdf_paths = list()
        for root, dirs, files in os.walk(self.folder_path):
            for file in files:
                if file.endswith('.pdf'):
                    pdf_paths.append(os.path.join(root, file))
        return pdf_paths

    def pdf_merge(self, merge_name='pdf_merge.pdf'):
        """

        :param merge_name: 合并后的文件名
        :return:
        """
        print('PDF合并开始...')
        pdf_lst = self.pdf_file_list()
        file_merger = PdfFileMerger()
        for pdf in pdf_lst:
            # 合并pdf文件
            file_merger.append(pdf)

        # 合并后的文件导出
        file_merger.write(os.path.join(self.folder_path, merge_name))
        print('PDF合并完成')


class App(wx.App):
    def OnInit(self):
        frame = PDFGuiFrame()
        frame.Show()
        return True


if __name__ == '__main__':
    app = App()
    app.MainLoop()

5.合并工具下载

PDF合并工具

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Python实现PDF合并工具(含源码) 的相关文章

为什么 matplotlib 底图没有绘制地图中某些区域的颜色？

下面的代码应该为越南的所有州着色 import pandas as pd import matplotlib pyplot as plt from mpl toolkits basemap import Basemap fig ax plt
Python 3.6 DateTime Strptime 返回错误，而 Python 3.7 运行良好

我刚刚为日期数据创建了一个数据类型它返回一个datetime datetime object 这是代码 import datetime class Date def new cls dateTime args kwargs return
将 Poetry 与 PyEnv 一起使用并遇到 Python 版本问题

我正在使用 WSL2 Ubuntu 我一直在学习使用 Fastapi 进行后端 API 开发的课程我相信我的 Ubuntu 默认 python 是 3 8 我正在尝试使用 python 3 10 0 进行开发我做了以下事情 pyenv安
在Python中不断寻找用户输入

我将如何编写一个始终寻找用户输入的 Python 程序我想我希望有一个等于输入的变量然后根据该变量的等于值会发生不同的情况因此如果变量是 w 那么它将执行某个命令并继续执行直到收到另一个输入例如 d 然后会发生不同的情况但直到
如何将 Google Cloud Storage 中的许多文件设为私有？

我进行了很多研究但无法为此提出解决方案以下是我用来在 GCP 中公开所有文件的代码 def make blob public bucket name blob name Makes a blob publicly accessible
如何使用 .pth 文件添加 Python 导入路径

如果我将 pth 文件放入 site packages 中则会给出一个ImportError 我不知道如何通过创建 pth 文件来导入指在Python中导入 https stackoverflow com questions 69728
如何在python中确定过去的时区特定日期是否是夏令时？

有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
从 Django 基于类的视图的 form_valid 方法调用特殊（非 HTTP）URL

如果你这样做的话有一个 HTML 技巧 a href New SMS Message a 点击新短信打开手机的本机短信应用程序并预先填写To包含所提供号码的字段在本例中为 1 408 555 1212 以及body与提供的消息 Hel
从 Python 将分层 JSON 数据写入 Excel xls？

我想将一些数据从 python 写入 xlsx 我目前将其存储为 JSON 但它从 Python 中输出什么并不重要单个文章的 JSON 如下所示 Word Count 50 Key Words Blah blah blah Foo Fr
如何使用 Twython 将 oauth_callback 值传递给 oauth/request_token

Twitter 最近刚刚强制执行以下规定 1 您必须通过oauth callbackoauth request token 的值这不是可选的即使您已经在 dev twitter com 上设置了一个如果您正在执行带外 OAuth 请通
Colab 的使用限制持续多久？

当我对同一帐户的两个笔记本同时使用两个 GPU 约半小时后 Colab 已 12 小时未运行此消息不断弹出由于 Colab 中的使用限制您当前无法连接到 GPU 自从我上次使用 colab 以来已经过去了大约两个小时但该消息仍然弹出
Python：绘制甘特图的模块

有没有一个好的Python绘图模块甘特图 http en wikipedia org wiki Gantt chart 我试过了开罗情节 http linil wordpress com 2008 09 16 cairoplot 11 但它
TypeError：“NoneType”对象不可下标[重复]

这个问题在这里已经有答案了错误 names curfetchone 0 TypeError NoneType object is not subscriptable 我尝试检查缩进但仍然有错误我读到如果数据库中没有文件名记录变量名
使用 Python 导入包含文本和数字数据的文件

I have a txt file which has text data and numerical data The first two rows of the file have essential information in te
安塞布尔 + 10.11.6

我在非常干净地安装 10 11 6 时遇到了 Ansible 的奇怪问题我已经安装了brew zsh oh my zsh Lil snitch 和1password 实际上没有安装其他任何东西我安装了ansible brew ins
获取 python 模块的 2 个独立实例

我正在与以非 OO 方式编写的 python 2 x API 进行交互它使用模块全局范围来处理一些内部状态驱动的东西在它不再是单例的情况下需要它并且修改原始代码不是我们的不是一个选择如果不使用单独解释器的子进程运行有什么方法可
Django：显示管理员验证错误的自定义错误消息

我正在使用 Django 1 2 4 我有一个模型其中有一个需要验证的字段当验证失败时我想向用户显示自定义错误消息模型编辑是在管理界面中完成的这就是我目前正在做的事情 def clean fields self exclude N
访问影子 DOM 中的元素

是否有可能查找 Shadow DOM 中的元素与蟒蛇硒示例用例我有这个input with type date
具有行业级约束的 SciPy 投资组合优化

尝试在这里优化投资组合权重分配通过限制风险来最大化我的回报函数我可以毫无问题地通过简单的约束所有权重之和等于 1 找到产生我的回报函数的优化权重并做出另一个约束即我的总风险低于目标风险我的问题是如何为每个组添加行业权重界限我
使用 python/scipy 进行 voronoi 和 lloyd 松弛

如何使用 Qhull 确定哪些 voronoi 单元按索引是正确的由现有顶点组成我正在尝试使用 LLoyds 算法和 scipy spatial Voronoi 它是 Qhull 的包装器生成的输入来执行约束松弛就代码而言

随机推荐

RC-u4 相对论大师(bfs求解指定路径)

PTA 程序设计类实验辅助教学平台题解 bfs可以求解从根节点到叶子节点的指定路径这里的vis 不是为了防止访问到父节点更多的是为了缩小路径长度 mpp和mp的映射也很巧妙开始我用的还是map
[从零开始学习FPGA编程-38]：进阶篇 -语法-函数与任务

作者主页文火冰糖的硅基工坊文火冰糖王文兵的博客文火冰糖的硅基工坊 CSDN博客本文网址目录前言第1章什么是函数Function 1 1 什么是函数 1 2 函
【JAVA】输入：Scaner

一语法 1 导入 import java util Scanner 2 创建对象 Scanner scanner new Scanner System in 3 创建变量 int x scanner nextInt next系列 next
服务器运维基础指南

服务器运维基础指南作为一个开发人员对于服务器的操作不可避免最常用的操作就是部署应用到服务器及在生产测试环境通过查看日志排查问题一般服务器都是linux操作系统并且是无图形界面的所以进行任何操作都是通过命令行由于从新一代程序员
Android 中的AIDL 和 binder机制

一 Binder 1 线程间通信Handler Handler和Binder是Android通信的两大支柱 Handler是线程间通信的基础一个App的运行一定是多个线程相互协作的过程特别是Android子线程不能更新UI界面的限制使得
微信使用精准位置 wx.getLocation步骤

微信小程序 gt 开发设置 gt 接口设置 gt 开通 wx getLocation 申请理由应当前业务涉及周边服务推荐需要需获取用户地理位置信息调试基础库 2 24 4 在app json中添加 requiredPrivateInf
VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确，应用程序未能启动”的问题...

VC9编译的程序在没有装过VC9 确切的说是 Net Framework3 5 的机器上运行时如果提示由于应用程序配置不正确应用程序未能启动重新安装应用程序可能会纠正这个问题这个错误那么就说明该程序动态链接了VC9的运行时库如
Java 实现 SCP 携带密码拷贝文件

package com miracle luna scp import org apache sshd client SshClient import org apache sshd client session ClientSession
线上阿里云短信盗刷问题实录

背景营销系统中有定时任务处理将待支付订单变更为已取消执行时间五分钟一次业务执行处理异常会发送短信给相关开发人员进行短信提醒从下午一点二十五开始开发人员间隔五分钟就会收到业务执行异常的短信提醒最初因为测试或是正式环境中确实有异常的
国产化系统下操作PDF

本文围绕使用netcore 跨平台在国产系统麒麟和统信操作PDF 首先netcore 需要第三方dll 在Nuget里搜索itextsharp 选择图片中安装即可版本写了 itextsharp 是4 16 比较靠后但是基本功能都有
Android反调试方法总结以及源码实现之检测篇（一）

好久没有更新博客了主要是忙项目的事今日总结一下在Android中常遇到的反调试方法一来帮助需要之人二来加深自己的理解反调试在代码保护中扮演着很重要的角色虽然不能完全阻止攻击者但是还是能加大攻击者的时间成本一般与加壳结合使用
手写SSH2服务器连接池

初衷在工作中遇到一个要与远程服务器建立连接并进行上传下载的场景所以在课余就试着写了一个ssh2服务器连接池的小demo 仅供参考欢迎指正目录概要 pom文件引入依赖
内网信息收集(一）

内网信息收集收集本机信息拿到一台服务器权限需要收集的信息包括操作系统 IP 是否存在杀毒软件打过的补丁等信息查询网络配置信息 ipconfig all Linux下使用ifconfig 查询用户列表 net user 查看本机列表
《重构的时机和方法》一本值得程序员都认真读的书

写在前面重构的时机和方法是一本关于软件开发中重构技术的书籍它以独特的风格和内容优势为读者提供了全面而易于理解的指导帮助他们在实际项目中应用重构技术提高代码质量和开发效率这本书由两个不同风格的部分组成旨在满足不同读者群体的需求
预训练模型与微调

前言预训练模型已经火了这么久了但作为菜本菜的我却还在用lstm 在生成任务上与同门学长用的预训练模型相比效果差的比较明显所以我决定走上预训练的不归路以下分享我的学习过程了解模型小说故事生成模型万事开头难上视频视频我喜欢
汕头大学医学院物理与计算机教研室,药剂学教研室 - 汕头大学医学院 Shantou University Medical College...

凌凯男中国医学科学院北京协和医学院清华大学医学部生物医学工程医学博士副研究员从事生物纳米检测新技术的研究与新型纳米肿瘤药物及疗法的研究以第一作者和通讯作者发表SCI论文8篇以项目负责人承担国家自然科学基金青年基金项目广
spring过滤器、拦截器

文章目录一二者对比二过滤器过滤器的分类过滤器的作用过滤器的实现方式三拦截器拦截器的实现方式四二者总结一二者对比实现原理不同过滤器是基于函数回调拦截器是基于java的反射机制的使用范围不同过滤器依赖与se
基于python图书馆管理系统和读者系统（附完整代码以及打包好的exe文件）

摘要本文基于python的图书馆管理系统和读者系统实现了登录注册忘记密码书籍查询借阅归还修改等功能通过csv文件将数据存储在本地注册时采用了邮箱验证码模拟了现实场景全部源代码地址见文末如果有其他奇思妙想或者bug欢
【pytorch目标检测】创新之作：Fast R-CNN算法解读

背景 2015年提出了Fast RCNN算法训练步骤实现端到端 CNN 基于VGG6 Fast R CNN是基于R CNN和SPPnets进行的改进成果训练速度比RCNN块9倍测试速度快乐23倍准确率68 4 SPPnets网络
Python实现PDF合并工具(含源码)

在工作中每个月都会要遇到报账的情况在现如今很多都是使用电子发票获得的电子发票很多都是PDF格式偶尔也有图片格式的而且还是一张发票一个pdf文档在打印贴票时就需要一个文档一个文档的打开打印十分的不便捷当然也可以使用某某PDF