从pdf文档中提取图像

2024-01-08

我知道以前也有人问过类似的问题，但是它们已经过时了（有些可以追溯到 2006 年）。

我有一个 .net 3.5 应用程序（带有 iTextSharp 5），我正在转换为 .net core（iText 7），它从 FedEx 跟踪文档中提取签名，并通过 SOAP 服务以 byte[] 数组形式发送。该代码多年来一直运行良好，仅进行了少量更新。从 Fedex 返回的 PDF 文档中有几个图像，但签名块不是 110x46 图像（这是 pdf 文件中的 fedex 徽标，因此我跳过它。）

PdfReader pdf = new PdfReader(FedexData);

for(Int32 iPage = 1; iPage <= pdfReader.NumberOfPages; iPage++)
{
   PdfDictionary pg = pdf.GetPageN(iPage);
   PdfDictionary res = (PdfDictionary)PdfReader.GetPdfObject(pg.Get(PdfName.RESOURCES));
   PdfDictionary xobj = (PdfDictionary)PdfReader.GetPdfObject(res.Get(PdfName.XOBJECT));

   foreach(PdfName name in xobj.Keys)
   {
      PdfObject obj = xobj.Get(name);

      if(obj.IsIndirect())
      {
          PdfDictionary tg = (PdfDictionary)PdfReader.GetPdfObject(obj);
          String width = tg.Get(PdfName.WIDTH).ToString();
          String height = tg.Get(PdfName.HEIGHT).ToString();
          String decode = tg.Contains(PdfName.DECODEPARMS) ? tg.Get(PdfName.DECODEPARMS).ToString() : "";
          String bitspercomponent = tg.Contains(PdfName.BITSPERCOMPONENT) ? tg.Get(PdfName.BITSPERCOMPONENT).ToString() : "";
          String colorspace = tg.Contains(PdfName.COLORSPACE) ? tg.Get(PdfName.COLORSPACE).ToString() : "";
          if(width != "110" && height != "46" && bitspercomponent != "1")
          {
                ImageRenderInfo imgRI = ImageRenderInfo.CreateForXObject(new GraphicsState(), (PRIndirectReference)obj, tg);
                PdfImageObject image = imgRI.GetImage();
                Image dotnetImg = image.GetDrawingImage();

                if(dotnetImg != null)
                {
                // process image and update database

可以说这段代码不适用于 iText7。我试图移植其中的一些，但我似乎没有得到图像......所以我显然做了一些不正确的事情，而且我自己对 iText7 函数的无知，这些函数似乎不提供与旧库的向下兼容性。

有人能给我指点 iText7 的教程吗？该教程涉及提取 PDF 文件中存储的图像？我找到了有关如何将 PDF 提取为图像（不是我想要的）、如何将图像存储在 PDF 文档中（与我想要的相反）的教程，以及类似问题的答案基于不再起作用的旧库。

谢谢，文号

这是一个 Java 实现IEventListener您可以使用它来访问特定页面的所有图像：

public class MyImageRenderListener implements IEventListener {

    protected String path;
    protected String extension;

    public MyImageRenderListener(String path) {
        this.path = path;
    }

    public void eventOccurred(IEventData data, EventType type) {
        switch (type) {
            case RENDER_IMAGE:
                try {
                    String filename;
                    FileOutputStream os;
                    ImageRenderInfo renderInfo = (ImageRenderInfo) data;
                    PdfImageXObject image = renderInfo.getImage();
                    if (image == null) {
                        return;
                    }

                    // You can access various value from dictionary here:
                    PdfString decodeParamsPdfStr = image.getPdfObject().getAsString(PdfName.DecodeParms);
                    String decodeParams = decodeParamsPdfStr != null ? decodeParamsPdfStr.toUnicodeString() : null;                      

                    byte[] imageByte = image.getImageBytes(true);
                    extension = image.identifyImageFileExtension();
                    // You can use raw image bytes directly, or write image to disk
                    filename = String.format(path, image.getPdfObject().getIndirectReference().getObjNumber(), extension);
                    os = new FileOutputStream(filename);
                    os.write(imageByte);
                    os.flush();
                    os.close();
                } catch (com.itextpdf.io.IOException | IOException e) {
                    System.out.println(e.getMessage());
                }
                break;

            default:
                break;
        }
    }

    public Set<EventType> getSupportedEvents() {
        return null;
    }
}

我已经评论了您可能感兴趣的一些部分。

以下是实际为所有页面或任何感兴趣的页面调用处理器的代码：

PdfDocument pdfDoc = new PdfDocument(new PdfReader(src));
IEventListener listener = new MyImageRenderListener(outPath);
PdfCanvasProcessor parser = new PdfCanvasProcessor(listener);
for (int i = 1; i <= pdfDoc.getNumberOfPages(); i++) {
    parser.processPageContent(pdfDoc.getPage(i));
}
pdfDoc.close();

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从pdf文档中提取图像的相关文章

将处理后的图形绘制到另一个图形中

我想将一个经过处理的图形绘制到另一个图形中 I have two graphics var gHead Graphics FromImage h var gBackground Graphics FromImage b Transform
赋值运算符和复制构造函数有什么区别？

我不明白C 中赋值构造函数和复制构造函数之间的区别是这样的 class A public A cout lt lt A A lt lt endl The copy constructor A a b The assignment cons
在 OpenCL 中将函数作为参数传递

是否可以在 OpenCL 1 2 中将函数指针传递给内核我知道可以用C实现但不知道如何在OpenCL的C中实现编辑我想做这篇文章中描述的同样的事情在 C 中如何将函数作为参数传递 https stackoverflow com q
通信对象 System.ServiceModel.Channels.ServiceChannel 不能用于通信

通信对象System ServiceModel Channels ServiceChannel 无法用于通信因为它处于故障状态这个错误到底是什么意思我该如何解决它您收到此错误是因为您让服务器端发生 NET 异常并且您没有捕获并处理
try-catch 中未处理的异常

try list from XElement e in d Descendants wix File where e Attribute Name Value Contains temp Name e Parent Parent Attri
为什么密码错误会导致“填充无效且无法删除”？

我需要一些简单的字符串加密所以我编写了以下代码有很多灵感来自here http www codeproject com KB security DotNetCrypto aspx create and initialize a cr
禁用 LINQ 上下文的所有延迟加载或强制预先加载

我有一个文档生成器目前包含约 200 个项目的查询但完成后可能会超过 500 个我最近注意到一些映射表示延迟加载这给文档生成器带来了一个问题因为它需要根据生成的文档来访问所有这些属性虽然我知道DataLoadOptions可以指
gdb 在 docker 上立即退出“进程已完成，退出代码 1”或 lldb“数据包返回错误 8”。另外：如何在 docker 中允许进行 C++ 调试

这花了我一整天的时间才找到所以我将其发布以供将来参考我正在 docker 镜像上开发 C 我正在使用克利翁我的代码是在调试模式下编译的并且在运行模式下运行良好但是当尝试调试时进程会立即退出并显示非常丰富的信息 Process
通过不同 DLL 或 EXE 中的指针或引用访问 STL 对象时发生访问冲突

我在使用旧版 VC6 时遇到以下问题我只是无法切换到现代编译器因为我正在处理遗留代码库 http support microsoft com kb 172396 http support microsoft com kb 172396
用于从字符串安全转换的辅助函数

回到 VB6 我编写了一些函数让我在编码时无需关心字符串的 null 和数字的 null 和 0 等之间的区别编码时没有什么比添加特殊情况更能降低我的工作效率了用于处理可能导致一些不相关错误的数据的代码 9999 10000 如果我
“MyClass”的类型初始值设定项引发异常

以下是我的Windows服务代码当我调试代码时我收到错误异常 CSMessageUtility CSDetails 的类型初始值设定项引发异常 using System using System Collections Generic
从匿名类型获取值

我有一个方法如下 public void MyMethod object obj implement 我这样称呼它 MyMethod new myparam waoww 那么我该如何实施MyMethod 获取 myparam 值 Edit
C# 搜索目录中包含字符串的所有文件，然后返回该字符串

使用用户在文本框中输入的内容我想搜索目录中的哪个文件包含该文本然后我想解析出信息但我似乎找不到该字符串或至少返回信息任何帮助将不胜感激我当前的代码 private void btnSearchSerial Click object
过期时自动重新填充缓存

我当前缓存方法调用的结果缓存代码遵循标准模式如果存在则使用缓存中的项目否则计算结果在返回之前将其缓存以供将来调用我想保护客户端代码免受缓存未命中的影响例如当项目过期时我正在考虑生成一个线程来等待缓存对象的生命周期然后运行
Silverlight Datagrid：在对列进行排序时突出显示整个列

我的 Silverlight 应用程序中有一个 DataGrid 我想在对该列进行排序时突出显示整个列它在概念上与上一个问题类似 Silverlight DataGrid 突出显示整列 https stackoverflow com qu
无法使用 Ninject 将依赖项注入到从 Angular 服务调用的 ASP.NET Web API 控制器中

我将 Ninject 与 ASP NET MVC 4 一起使用我正在使用存储库并希望进行构造函数注入以将存储库传递给其中一个控制器这是实现 StatTracker 接口的上下文对象 EntityFramework public cla
运行代码首先迁移更新数据库时出错

我在迁移到数据库时遇到问题并且似乎找不到我遇到的错误的答案 System MissingMethodException Method not found System Data Entity Migrations Builders Tab
同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

我目前正在编写一个应用程序该应用程序将捕获大量 RTSP 流在我的例子中为 12 个并将其显示在 QT 小部件上当我超过大约 6 7 个流时问题就会出现 CPU 使用率激增并且出现明显的卡顿我认为它不是 QT 绘制函数的原因是因
过度使用委托对性能来说是一个坏主意吗？ [复制]

这个问题在这里已经有答案了考虑以下代码 if IsDebuggingEnabled instance Log GetDetailedDebugInfo GetDetailedDebugInfo 可能是一个昂贵的方法因此我们只想在调试模式
从类模板参数为 asm 生成唯一的字符串文字

我有一个非常特殊的情况我需要为类模板中声明的变量生成唯一的汇编程序名称我需要该名称对于类模板的每个实例都是唯一的并且我需要将其传递给asm关键字 see here https gcc gnu org onlinedocs gcc 12

随机推荐

使用 Javascript 在多个 CSS 文件之间切换

我目前正在尝试制作一系列按钮网站的用户可以单击这些按钮来在不同的 CSS3 文件之间进行更改这将改变某些效果为了实现这个目标我需要某种方式来访问 href example1 css 我的 HTML 中的标签并将其更改为 href
Jenkins - 最大并发作业数

我可以在 Jenkins 中同时运行的最大作业数是多少 Jenkins 作业的最大数量取决于您在主站和从站中设置的限制通常我们会限制核心数量但您的里程可能会有所不同具体取决于可用内存磁盘速度 SSD 的可用性以及源代码的重叠对于
如何更改 F# 交互式换行符

在 fs 文件中换行符表示为 r n 但在 F 交互窗口中是 n 在我当前正在尝试解决的问题中多行文字字符串的长度很重要因此当我在 F 交互窗口中测试代码时出现问题因为字符串的长度与正常执行时的长度不同我希望有一个选项可以将 F
jQuery DataTables sDom 命令不起作用

我需要左上角的过滤器和右上角的大小但不起作用 document ready function jQuery example dataTable sDom lt top fl gt rt lt bottom ip gt lt clea
在vba中一次循环遍历所有可用的自动筛选条件

我想知道是否有一种方法可以获取列表中所有不同的自动过滤条件以便迭代每个条件最后复制并粘贴每个不同的表这些表在迭代时会显示在单独的工作表中理想情况下这将运行 n 次 ActiveSheet Range AllRows AutoFil
我应该关心 React Redux 应用程序中的状态变化率吗？

我正在使用 React Redux 和 Websocket 实现评估实时 Web 应用程序在服务器上我的数据集以每秒大约 32 次更改的速度发生更改每次更改都会使用 Websocket 向应用程序发送一条异步消息异步消息在我的
用于 Java 的 LZ4 和 Zstd

是否有适用于 LZ4 和 ZStd 的最佳 Java 压缩库我尝试过 apache commons 这是 zstd jni 实现 String fileURL TestFileUtil getFileURL TestFileCategor
实现 (.m) 文件中的 IBOutlet 实例变量

假设我有一个视图控制器或窗口控制器它像往常一样是相应 XIB 文件中的文件所有者众所周知这是很常见的IBOutlet然后您可以使用 Interface Builder 在 XIB 中连接控制器类到目前为止我一直在创造IBOu
选择以下划线（_）开头的所有对象键

我需要在以下对象中创建一个包含所有键而不是值的数组其中键以下划线开头在下面的代码片段中我试图得到getSubscriptions 回来 foo1 foo2 let myObj foo0 test foo1 test foo2 tes
使用 JavaScript 在浏览器中触发全屏 [重复]

这个问题在这里已经有答案了可能的重复如何在Javascript中制作全屏窗口伸展到整个屏幕 https stackoverflow com questions 1125084 how to make in javascript ful
禁用 DrawerLayout 的稀松布触摸手势

我需要禁用稀松布上的触摸手势红色突出显示的部分我只想通过滑动来关闭抽屉问题是当抽屉布局打开并且我需要从红色突出显示部分下方的 ListView 中选择一个元素时发生的情况是抽屉关闭只有此时我才能从 ListView 中选择一个元
Jenkinsfile 参数化构建中的环境和参数之间有什么关系？

最近我在与同事一起进行 Jenkins 构建时遇到了一些难题他一直在使用params VARIABLE and env VARIABLE可以互换并且没有任何问题与此同时我开始在他通过这行代码的环境对参数对象的调用之一中收到空对象错误
通过在 Javascript 中单击外部来关闭下拉菜单（教程说明）

我尝试通过以下方式使用 Javascript 实现打开和关闭下拉菜单的方法this https www w3schools com howto howto js dropdown aspw3schools com 上的教程虽然显示下拉
PHP - 一小时后检查 json 值

我创建了一个函数它使用 json 获取 Twitter 计数但是我想在一段时间后例如一个小时再次检查一次但目前它每次加载页面时都会进行检查以及这会影响页面加载时间已经有一个 PHP 函数可以完全满足我的要求但我不记得它了
HTTP GET 请求、ASP - 我迷路了！

将 VBScript 与 ASP 结合使用我尝试设置一个 HTTP GET 请求该请求将访问一个页面该页面又生成一行 ASCII 非 HTML 然后我想将 ASCII 行包含由分号分隔的 4 个值推断回原始 ASP 页面中的 4
如何在 POST 请求后返回重定向到 Django 中的上一页

我正在编写一个新闻网站在详细新闻页面中有一个评论喷泉如果人们想发表评论他们需要先登录我想让他们登录成功后页面可以返回到上一个新闻页面这是我的观点 py def newsDetailView request news pk ne
Rails 3 库只有在需要时才加载

我正在尝试在 Rails 3 中加载 Tokbox SDK 我已将该库放置在 lib 目录中因此目前我的目录结构如下所示 libopentok rb OpenTok异常 rbOpenTokSDK rb会话 rb 我使用 applicati
如何将所有 C# 8 可空引用警告视为错误？

使用 Visual Studio 2019 v16 3 2 将 NET Core 3 0 项目设置为 C 8 并启用可为 null 的引用类型
如何在 Xcode 中创建具有多列的 UI TableView？

我正在使用 Xcode 开发 iOS 8 应用程序我需要在一个视图中显示一张包含多列和多行数据的表 Example Name Time In Time Out ETA Johnnys Supplies 8 30AM 9 00AM 10 1
从pdf文档中提取图像

我知道以前也有人问过类似的问题但是它们已经过时了有些可以追溯到 2006 年我有一个 net 3 5 应用程序带有 iTextSharp 5 我正在转换为 net core iText 7 它从 FedEx 跟踪文档中提取签名并通

从pdf文档中提取图像

从pdf文档中提取图像 的相关文章

随机推荐

热门标签

从pdf文档中提取图像的相关文章