使用 iTextSharp 压缩 PDF [关闭]

2024-04-14

我目前正在尝试重新压缩已创建的pdf，我正在尝试找到一种方法来重新压缩文档中的图像，以减小文件大小。

我一直在尝试使用 DataLogics PDE 和 iTextSharp 库来执行此操作，但我找不到对项目进行流重新压缩的方法。

我曾经想过循环遍历 xobjects 并获取图像，然后将 DPI 降至 96 或使用 libjpeg C# implimentation 来更改图像的质量，但将其放回 pdf 流似乎总是会导致内存损坏或其他一些问题。

任何样品将不胜感激。

Thanks

iText 和 iTextSharp 有一些替换间接对象的方法。具体有PdfReader.KillIndirect()它按照它所说的去做PdfWriter.AddDirectImageSimple(iTextSharp.text.Image, PRIndirectReference)然后你可以用它来代替你杀死的东西。

在伪 C# 代码中，您可以执行以下操作：

var oldImage = PdfReader.GetPdfObject();
var newImage = YourImageCompressionFunction(oldImage);
PdfReader.KillIndirect(oldImage);
yourPdfWriter.AddDirectImageSimple(newImage, (PRIndirectReference)oldImage);

将原始字节转换为 .Net 图像可能很棘手，我将其留给您，或者您可以在此处搜索。马克有一个这里有很好的描述 https://stackoverflow.com/a/5953834/231316。另外，从技术上讲，PDF 没有 DPI 的概念，这主要是针对打印机的。在这里查看答案 https://stackoverflow.com/a/8245450/231316了解更多相关信息。

使用上述方法，您的压缩算法实际上可以做两件事：物理缩小图像以及应用 JPEG 压缩。当您物理缩小图像并将其添加回来时，它将占用与原始图像相同的空间，但可使用的像素更少。这将使您得到您认为的 DPI 降低。 JPEG 压缩是不言而喻的。

下面是一个针对 iTextSharp 5.1.1.0 的完整工作 C# 2010 WinForms 应用程序。它会获取桌面上名为“LargeImage.jpg”的现有 JPEG 并从中创建一个新的 PDF。然后它打开 PDF，提取图像，将其物理缩小到原始大小的 90%，应用 85% JPEG 压缩并将其写回 PDF。请参阅代码中的注释以获取更多解释。该代码需要更多的空/错误检查。还寻找NOTE您需要扩展以处理其他情况的注释。

using System;
using System.Drawing;
using System.Drawing.Imaging;
using System.Drawing.Drawing2D;
using System.Windows.Forms;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;

namespace WindowsFormsApplication1 {
    public partial class Form1 : Form {
        public Form1() {
            InitializeComponent();
        }

        private void Form1_Load(object sender, EventArgs e) {
            //Our working folder
            string workingFolder = Environment.GetFolderPath(Environment.SpecialFolder.Desktop);
            //Large image to add to sample PDF
            string largeImage = Path.Combine(workingFolder, "LargeImage.jpg");
            //Name of large PDF to create
            string largePDF = Path.Combine(workingFolder, "Large.pdf");
            //Name of compressed PDF to create
            string smallPDF = Path.Combine(workingFolder, "Small.pdf");

            //Create a sample PDF containing our large image, for demo purposes only, nothing special here
            using (FileStream fs = new FileStream(largePDF, FileMode.Create, FileAccess.Write, FileShare.None)) {
                using (Document doc = new Document()) {
                    using (PdfWriter writer = PdfWriter.GetInstance(doc, fs)) {
                        doc.Open();

                        iTextSharp.text.Image importImage = iTextSharp.text.Image.GetInstance(largeImage);
                        doc.SetPageSize(new iTextSharp.text.Rectangle(0, 0, importImage.Width, importImage.Height));
                        doc.SetMargins(0, 0, 0, 0);
                        doc.NewPage();
                        doc.Add(importImage);

                        doc.Close();
                    }
                }
            }

            //Now we're going to open the above PDF and compress things

            //Bind a reader to our large PDF
            PdfReader reader = new PdfReader(largePDF);
            //Create our output PDF
            using (FileStream fs = new FileStream(smallPDF, FileMode.Create, FileAccess.Write, FileShare.None)) {
                //Bind a stamper to the file and our reader
                using (PdfStamper stamper = new PdfStamper(reader, fs)) {
                    //NOTE: This code only deals with page 1, you'd want to loop more for your code
                    //Get page 1
                    PdfDictionary page = reader.GetPageN(1);
                    //Get the xobject structure
                    PdfDictionary resources = (PdfDictionary)PdfReader.GetPdfObject(page.Get(PdfName.RESOURCES));
                    PdfDictionary xobject = (PdfDictionary)PdfReader.GetPdfObject(resources.Get(PdfName.XOBJECT));
                    if (xobject != null) {
                        PdfObject obj;
                        //Loop through each key
                        foreach (PdfName name in xobject.Keys) {
                            obj = xobject.Get(name);
                            if (obj.IsIndirect()) {
                                //Get the current key as a PDF object
                                PdfDictionary imgObject = (PdfDictionary)PdfReader.GetPdfObject(obj);
                                //See if its an image
                                if (imgObject.Get(PdfName.SUBTYPE).Equals(PdfName.IMAGE)) {
                                    //NOTE: There's a bunch of different types of filters, I'm only handing the simplest one here which is basically raw JPG, you'll have to research others
                                    if (imgObject.Get(PdfName.FILTER).Equals(PdfName.DCTDECODE)) {
                                        //Get the raw bytes of the current image
                                        byte[] oldBytes = PdfReader.GetStreamBytesRaw((PRStream)imgObject);
                                        //Will hold bytes of the compressed image later
                                        byte[] newBytes;
                                        //Wrap a stream around our original image
                                        using (MemoryStream sourceMS = new MemoryStream(oldBytes)) {
                                            //Convert the bytes into a .Net image
                                            using (System.Drawing.Image oldImage = Bitmap.FromStream(sourceMS)) {
                                                //Shrink the image to 90% of the original
                                                using (System.Drawing.Image newImage = ShrinkImage(oldImage, 0.9f)) {
                                                    //Convert the image to bytes using JPG at 85%
                                                    newBytes = ConvertImageToBytes(newImage, 85);
                                                }
                                            }
                                        }
                                        //Create a new iTextSharp image from our bytes
                                        iTextSharp.text.Image compressedImage = iTextSharp.text.Image.GetInstance(newBytes);
                                        //Kill off the old image
                                        PdfReader.KillIndirect(obj);
                                        //Add our image in its place
                                        stamper.Writer.AddDirectImageSimple(compressedImage, (PRIndirectReference)obj);
                                    }
                                }
                            }
                        }
                    }
                }
            }

            this.Close();
        }

        //Standard image save code from MSDN, returns a byte array
        private static byte[] ConvertImageToBytes(System.Drawing.Image image, long compressionLevel) {
            if (compressionLevel < 0) {
                compressionLevel = 0;
            } else if (compressionLevel > 100) {
                compressionLevel = 100;
            }
            ImageCodecInfo jgpEncoder = GetEncoder(ImageFormat.Jpeg);

            System.Drawing.Imaging.Encoder myEncoder = System.Drawing.Imaging.Encoder.Quality;
            EncoderParameters myEncoderParameters = new EncoderParameters(1);
            EncoderParameter myEncoderParameter = new EncoderParameter(myEncoder, compressionLevel);
            myEncoderParameters.Param[0] = myEncoderParameter;
            using (MemoryStream ms = new MemoryStream()) {
                image.Save(ms, jgpEncoder, myEncoderParameters);
                return ms.ToArray();
            }

        }
        //standard code from MSDN
        private static ImageCodecInfo GetEncoder(ImageFormat format) {
            ImageCodecInfo[] codecs = ImageCodecInfo.GetImageDecoders();
            foreach (ImageCodecInfo codec in codecs) {
                if (codec.FormatID == format.Guid) {
                    return codec;
                }
            }
            return null;
        }
        //Standard high quality thumbnail generation from http://weblogs.asp.net/gunnarpeipman/archive/2009/04/02/resizing-images-without-loss-of-quality.aspx
        private static System.Drawing.Image ShrinkImage(System.Drawing.Image sourceImage, float scaleFactor) {
            int newWidth = Convert.ToInt32(sourceImage.Width * scaleFactor);
            int newHeight = Convert.ToInt32(sourceImage.Height * scaleFactor);

            var thumbnailBitmap = new Bitmap(newWidth, newHeight);
            using (Graphics g = Graphics.FromImage(thumbnailBitmap)) {
                g.CompositingQuality = CompositingQuality.HighQuality;
                g.SmoothingMode = SmoothingMode.HighQuality;
                g.InterpolationMode = InterpolationMode.HighQualityBicubic;
                System.Drawing.Rectangle imageRectangle = new System.Drawing.Rectangle(0, 0, newWidth, newHeight);
                g.DrawImage(sourceImage, imageRectangle);
            }
            return thumbnailBitmap;
        }
    }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 iTextSharp 压缩 PDF [关闭] 的相关文章

使用接口将泛型委托转换为另一种类型

使用 NET 4 0 好的所以我有 private Dictionary
比较 boost::system::error_category

对于 errorCode category name 输出 asio misc 和 errorCode message 输出文件结束的错误以下比较失败如果它声称属于 asio misc 类别那么为什么 errorCode cate
用于 C# 和 iPhone 应用程序的 MongoDB

我正处于设计应用程序的初始阶段该应用程序将具有用 C 实现的后端该后端将使用 IIS 上托管的 WCF Web 服务为其他平台提供数据 iPhone 就是其中之一由于是个人项目所以想用它来学习MongoDB 我已经知道有社区开发的
在C#中创建对象而不使用new关键字？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 有没有一种方法可以在 C 中不使用
ASP.NET MVC：DropDownListFor 未选择任何选项

我用它来填充 ASP NET MVC 视图中的下拉列表调试这个我可以看到Selected属性设置为true当它应该是的时候但是当渲染视图时列表中的任何选项都不
如何在 C 中的 for (;;) 循环中声明多个变量？

我认为可以在一个变量中声明多个变量for loop for int i 0 char ptr bam i lt 10 i 但我刚刚发现这是不可能的 GCC 给出以下错误错误 char 之前应有不合格的 id 你真的不能在一个变量中声明不同
设置 DataContract 和 DataMember 而不包含所有属性

我找到了 DataContract and DataMember 属性有点混乱宁愿使用配置方法或其他内容中的代码来完成此操作这可能吗您根本不必使用这些属性 DataContractSerializer将使用 getter 和 sett
错误：无法找到“async”修饰符所需的所有类型。您是否定位了错误的框架版本，或者缺少对程序集的引用？

我的电脑配置如下视窗8 视觉工作室2012 NET框架4 5 我的项目配置是 WP 7 1 银光4 0 NET框架4 0 CTP ASYNC 已安装使用 async 和await 关键字该项目是在Windows 7机器上使用VS201
gdb 通过指向错误的代码行显示不正确的回溯

我们可以通过在源代码中包含多个中止调用用非常简单的示例重现此问题在下面的示例代码中我们在不同条件下总共有四个中止调用但是当我们使用优化标志 O3 进行编译时我们只能看到一个中止调用的调试信息因此在这四个中止调用中发生崩溃时 g
如何在 Visual Studio 2017 项目（新的 .csproj 文件格式）中设置“OutputPath”，而不会使目标框架扰乱解析的路径？

Setting OutputPath在新的 Visual Studio 2017 项目格式中会自动在路径中添加目标框架例如如果我在项目文件中设置了这些
迭代 C++ 映射中的键

有没有办法迭代键而不是 C 映射对地图是关联容器因此迭代器是一对key val 如果您只需要键则可以忽略该对中的值部分 for std map
如何将 C# 6 与网站项目类型一起使用？

更新了现有的Web Site项目类型Visual Studio 2015 我将Framework更改为4 6 然后我希望在我的代码隐藏文件中可以使用所有这些新功能不幸的是我收到如下错误错误 CS8026 功能表达式主体属性在 C 5
登录成功后身份服务器不重定向

我正在尝试使用 MVC 客户端设置 IdentityServer4 一切工作正常直到我想添加 ASP 身份当我添加代码来使用 SQL Server 和 Identity 时成功登录后 Identity 服务器不会将我重定向回客户端而
C# 中的时间跨度总和

我有一个包含 TimeSpan 变量的对象集合 MyObject TimeSpan TheDuration get set 我想使用 LINQ 来计算这些时间的总和当然从 MyCollection 中的 r 选择 r TheDurati
使用 Regex/C# 将转换为

奇怪的问题但我不会浪费时间解释为什么我需要这样做只是我需要这样做我有以下内容
c 中的帕斯卡三角形与递归函数

您好这是我用于计算帕斯卡三角形的代码但它运行错误已停止工作为什么我认为它的错误在于 paskal 函数 include
VSTS 构建失败并显示 MSB4184 路径不是合法形式

我正在尝试使用 VSTS 中的构建系统来构建和部署 c net Web 应用程序我创建了一个新的单项目解决方案因为似乎没有任何方法可以指定在多项目解决方案中构建部署哪个项目并设置我的构建定义以指向这个新解决方案我已将其设置为使用
模板编译错误 - 没有匹配的调用函数

我正在尝试将字符串转换为数字为此我找到了以下方法 include
是否可以从C语言函数写入word文件？

我有一个用 C 语言编写的图书馆管理系统其中有 I O 文件 dat 如何从该函数中获取word文件的输出 void viewbooks void show the list of book persists in library int
C++ 中的编译器指令重新排序优化（以及阻碍它们的因素）

我已将代码缩减为以下内容这在保留我感兴趣的编译器输出的同时尽可能简单 void foo const uint64 t used uint64 t ar 100 for int i 0 i lt 100 i ar i some globa

随机推荐

unordered_map线程安全

我正在使用 boost thread 库将单线程程序更改为多线程程序该程序使用 unordered map 作为 hasp map 进行查找我的问题是某一时刻许多线程将进行写入而另一时刻许多线程将进行读取但不会同时进行读取和写
使用来自不同数组的属性更新数组，并且两个数组具有相同的键 - javascript

我有以下数组假定它是大数据集 let response1 userID 2222 dataOne Object Object userID 6666 dataOne Object dataTwo Object Object userID
如何编写一个测试友好的不可变值类？

我将不可变数据模型类标记为final确保更改其值的唯一方法是创建一个新实例不幸的是这些字段不能是最终的因为它们需要由 Hibernate 填充这工作得很好直到我想检查另一个类在使用模型的无效实例调用时是否抛出正确的异常模型的构造
无法使用本机捆绑 exe 启动 JavaFX 应用程序

我创建了一个 JavaFX 应用程序并使用以下命令创建了其本机包Ant 当我尝试使用双击创建的捆绑包中的 Jar 启动应用程序时它成功启动了我的应用程序但是当我尝试双击 MyApplication exe 比如说时它抛出JavaF
如何更改julia(1.8.5)默认安装包的位置？

如何更改julia 1 8 5 默认安装包的位置我不想把包安装到c盘因为pwd 和homedir 都默认到c盘如何修改我想每次都像安装python包一样打开Julia 有固定的安装路径例如user Base User site 我
防止调试期间出现 ApplicationNotResponding

我对 Android 很陌生并且遇到了调试问题我知道 ANR 的用途但在正常运行应用程序时看不到它们但是当我尝试调试 BoradcastReceiver 时速度太慢并收到 ANR 消息有没有办法在调试会话期间关闭 ANR 我可
尽管存在主键，SQLAlchemy 经典映射器“无法为映射表组装任何主键列”？

我正在使用 Alembic 和 SQLAlchemy 开发一个项目但在数据库中创建一个简单条目作为测试时遇到问题我收到以下错误 sqlalchemy exc ArgumentError Mapper Mapper Sale sales
Xcode 未安装 watchOS 应用程序以在设备上进行调试

这是在 watchOS 4 3 beta 15T5165e 和 Xcode 9 3 beta 9Q98q 上但我不认为这是因为它们处于 beta 阶段因为另一个 WatchKit 项目在设备上运行得很好我尝试过取消配对修复重新启动
] 的基数' aria-label='InvalidBasesError：无法解析 [] 的基数'> InvalidBasesError：无法解析 [] 的基数

当我运行测试时我在数据库初始化期间收到此错误 django db migrations state InvalidBasesError Cannot resolve bases for
REQUEST_TIME 在 PHP 中意味着什么？

是我单击 HTML 表单上的发送按钮的时间还是它到达服务器的时间 Edit 我已经阅读了手册谷歌搜索了其他来源包括SO 我找到的最清晰的定义对我来说仍然含糊不清因为我不知道请求开始其含义与下面的定义完全相同 REQUEST TIME
错误 MSB6006：“cmd.exe”退出，代码为 3

我在尝试构建使用 QT 的 C 项目时出现此错误我已经检查了下面的链接但用户没有说出解决方案 http social msdn microsoft com Forums en US msbuild thread 5b0be7be 1b6
如何在本机 C++ 程序中托管 WCF 服务

我有一个用 C 编程的 Windows Communication Foundation WCF 服务我需要将其托管在我的 C MFC 本机应用程序中无 C CLI 我不知道该怎么做客户端也是一个 C 应用程序谁能帮我吗好的如果
按下操作按钮之前加载微调器

下面是我放置旋转器加载的示例应用程序但问题是即使在按下操作按钮之前旋转器就已经被看到了实际上只有当按下操作按钮时它才应该出现我知道这可以通过添加来实现eventReactive 但是有没有办法仅通过使用来实现这一点observ
如果 OSX/iOS 中的网络代理设置发生更改，是否有办法接收通知/回调？

如果 OSX iOS C C 或 Objective C 中的网络代理设置发生更改我想收到通知回调吗有人有关于如何执行此操作的示例吗监控系统配置SCDynamicStoreSetNotificationKeys 对于您需要注意的按键
打开解析推送通知时出现异常[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案 I setup 解析推送Android SDK 1 7 0 https parse com docs android g
在 Spring 的 RequestMapping 中，{parameter:.+} 与 {parameter} 有什么不同吗？

我正在查看一些使用 RequestMapping 的 Spring 代码如下所示 RequestMapping foo bar 这在功能上与以下有什么不同吗 RequestMapping foo bar 据我所知 RegExp 始终应用于
给定最大成本，找到具有最小成本和最大长度的路径

我正在寻找一种算法以在无向加权完整图中给定最大成本的情况下找到具有最小成本和最大长度的两个节点之间的路径权重非负就我现在而言我正在使用 DFS 而且它非常慢节点数量较多长度也最大我已经在 DFS 的每次迭代中丢弃了所有不可能的
以编程方式设置文本时，如何避免出现自动完成下拉列表？

我的布局中有一个 AutoCompleteTextView 我还有另一种方法来选择 AutoCompleteTextView 中存在的相同项目当选择替代方式时我通过以下方式填充 AutoCompleteTextView 中的值 auto
如何在QT中发送和接收UDP数据包

我正在 QT 中编写一个小型应用程序它通过本地网络发送广播 UDP 数据包并等待来自网络上的一个或多个设备的 UDP 响应数据包创建套接字并发送广播数据包 udpSocketSend new QUdpSocket this udpSo
使用 iTextSharp 压缩 PDF [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我目前正在尝试重新压缩已创建的pdf 我正在尝试找到一种方法来重新压缩文档中的图像以减小文件大小我一直在尝试使用 DataLogi

使用 iTextSharp 压缩 PDF [关闭]

使用 iTextSharp 压缩 PDF [关闭] 的相关文章

随机推荐

热门标签