itextsharp - 阅读 1 列（第 1 页）和 2 列（第 2 页）的 PDF 时出现问题

2024-03-25

当打开首页上只有一列而其他页面上有超过一列的 PDF 文件时，我的下面的代码丢失了。

有人可以告诉我我做错了什么吗？下面是我的代码：

PdfReader pdfreader = new PdfReader(pathNmArq);
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();

    for (int page=1; page <= lastPage; page++) 
    {
         extractText = PdfTextExtractor.GetTextFromPage(pdfreader, page, strategy);
         extractText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(extractText)));
        / / ... 
    }

您使用SimpleTextExtractionStrategy。该策略假设PDF中的文本绘制指令按阅读顺序排序。就你而言，情况似乎并非如此。

如果您不能指望包含按阅读顺序绘制操作的 PDF，而仅使用分布中的 iText 文本提取策略，则您必须了解构成单列的区域。如果页面包含多个列，则必须使用RegionTextRenderFilter限制为一列，然后使用LocationTextExtractionStrategy.

PS:你的意图到底是什么

extractText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(extractText)));

line?

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

itext

itextsharp - 阅读 1 列（第 1 页）和 2 列（第 2 页）的 PDF 时出现问题的相关文章

如何扩展PDF页面大小以添加水印？

我的网络应用程序签署 PDF 文档我想让用户下载原始 PDF 文档未签名但在 pdf 文档的左边距添加图像和签名者我在另一个网络应用程序中看到了这个想法我也想这样做当然我想使用 itext 库来做到这一点我附上了两张图片原始
在 pdf 中添加撤销详细信息，同时签名

我已经使用 PC 上附加的数字令牌对 pdf 进行了数字签名使用库 itext Sharp 附加相同的内容当我在 adobe reader 中打开相同内容时它显示无法执行撤销当我看到详细信息时它显示颁发者证书之一被撤销未检查错误
如何在 C# 中使用 itextsharp 创建带有泰米尔字体的 PDF 文件？

我们正在 C 应用程序中通过传递泰米尔语文本印度语言之一来创建 pdf 文件因此我已经为我的泰米尔语字体安装了 AVVAIYAR TTF 泰米尔语字体之一字体但是当我运行下面提到的命令时pgm 创建的pdf文件不包含任何泰米尔字
itextsharp - 阅读 1 列（第 1 页）和 2 列（第 2 页）的 PDF 时出现问题

当打开首页上只有一列而其他页面上有超过一列的 PDF 文件时我的下面的代码丢失了有人可以告诉我我做错了什么吗下面是我的代码 PdfReader pdfreader new PdfReader pathNmArq ITextExtrac
在 C# 中使用 iTextSharp 在 PDF 中添加多个数字签名

我已经使用 iTextSharp Dll 实现了数字签名以使用单个签名对 PDF 文件进行签名现在我想在之前或已经进行数字签名的 PDF 中添加另一个数字签名但在验证一个签名时出现错误如何在一份 PDF 中添加多个数字签名并验证所
iTextSharp：“文档未打开”错误 - 当它实际上是时

我有这个代码 private static byte ConvertPdfDocument Document document PdfPTable headerTable PdfPTable affidavitsTable byte b u
从 URL 添加图像到 PDF？

我正在尝试将 URL 地址中的图像添加到我的 pdf 中代码是 Image image Image getInstance http www google com intl en ALL images logos images logo
iTextSharp 如何读取PDF文件中的表格

我正在努力将 PDF 转换为文本我可以正确地从 PDF 中获取文本但表结构很复杂我知道 PDF 不支持表格结构但我认为有一种方法可以正确获取单元格嗯例如我想转换成这样的文本 gt This is first example g
用java将图像写入pdf文件

我正在编写一个代码将 Microsoft power point ppt 幻灯片转换为图像并将生成的图像写入 pdf 文件以下代码生成图像并将其写入 pdf 文件但我面临的问题是当我将图像写入 pdf 文件时它的大小超出了 pd
如何生成不带绿色复选标记的签名 PDF

我正在使用 iText 签署 PDF 我在签名中添加了图形这是可行的但是验证文档时显示的绿色复选标记或黄色问号会干扰我插入的图形使最终结果看起来很难看它要么显示在签名图形的上方或下方但我无法让它消失有谁知道如何解决这一问题
在 ITextSharp 免费许可证下动态创建 .pdf

在 ASP NET C 网站服务器中我使用名为 ITextSharp 的 pdf 创建器库来创建包含有关产品的文本和一些图像的 pdf 像往常一样老板不想购买许可证我知道如果我使用 ITextSharp 版本 4 1 6 或更低版本
“setIndentationLeft”不是“iTextsharp.text.Paragraph”的成员

我正在添加出现错误的段落 p setindentationLeft 不是 itextsharp text paragraph 的成员 Dim bf As BaseFont BaseFont CreateFont Dim p As New P
使用 C# 代码使用 iTextSharp 将页面书签添加到现有 PDF

我的要求与这个问题中描述的相同使用 iTextSharp 4 1 6 为特定页面添加书签 https stackoverflow com questions 19360946 bookmark to specific page using
iTextSharp 居中对齐文档对象内的对象

是否有一种快速而简单的方法可以将文档对象中的对象居中对齐 Without执行任何计算逻辑即获取页面宽度获取内容宽度除以二等我在 Document 对象内的 Paragraph 对象中有一个 PdfPTable 对象我想将段落对象
iTextSharp - 如何将 PDFPRow 添加到 PDFPTable？

我想将 PDFPCells 数组添加到 PDFPRow 然后将 PDFPRow 添加到 PDFPTable 但我似乎无法在 PDFPTable 中找到为此的方法然而有一个 PDFPTable AddCell 有任何想法吗查看PdfPTa
如何在 iText 中获取新页面

去新页面有点问题pdfContentByte 我使用下面的代码将数据放在第一页之后到下一页但不幸的是iText不生成新页面 step1 itextDocument new com itextpdf text Document PageSi
如何使用 iTextSharp 插入 HTML 标记以使用 C# 创建 PDF？

I am new to iTextSharp API to create PDF I want to Create the a PDF similar shown in following image I have added Table
是否可以“缩小”PdfPtable？

我目前正在使用 Itextsharp 但在使用 PDfPtables 时遇到一些问题有时它们对于一个页面来说太大了并且当添加到文档中时它们会被分成多个页面可悲的是这种理性的行为对于我的一些上级来说是不可接受的他们一直坚持认为表
使用 iTextSharp CSSResolver 类的命名空间

我正在使用 iTextSharp CSSResolver 类在 vb net 中使用外部 css 请让我知道使用的命名空间XMLWorkerFontProvider CssFilesImpl StyleAttrCSSResolver类下面
itextsharp读取表[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我使用 itextsharp 创建了一个带有表格的 pdf 我找到了一个例子http itextsharp sourceforge n

随机推荐

Scala import 语句位于 scala 类的顶部和内部

在scala中这两种导入策略有什么区别 Option 1 import com somepackage class MyClass further code Option 2 class MyClass import com somepac
我可以更改 apk 的版本代码吗？

我为 Android 构建了一个应用程序并且已经将其导出为 apk 如果已经导出我可以更改其版本代码吗我怎样才能做到这一点我丢失了备份代码我只有更新版本需要返回第一个版本我唯一能做的就是从 apk 备份中增加版本代码然后我的
php中计算每个子数组中的元素

一个例子来自php net http php net manual en function count php提供以下内容如何独立于 food 数组输出 3 获取水果和蔬菜的数量你可以这样做 e
当 Flexbox 项目以列模式换行时，容器不会增加其宽度

我正在研究一个嵌套的弹性盒布局它应该按如下方式工作最外层 ul main 是一个水平列表当向其中添加更多项目时该列表必须向右扩展如果它变得太大应该有一个水平滚动条 main display flex flex direction
maven2：从 WAR 中排除目录

I tried this http maven apache org plugins maven war plugin examples adding filtering webresources html从我的 WAR 文件中排除整个目录
查找将一个 NumPy ndarray 的行映射到另一个 NumPy ndarray 的一组索引

我有两个结构化的 2Dnumpy数组是equal原则上意义 A numpy array a1 b1 c1 a2 b2 c2 a3 b3 c3 a4 b4 c4 B numpy array a2 b2 c2 a4 b4 c4 a3 b3 c
在 React 中将类组件转换为函数式组件

我正在学习 React hooks 因此为了做到这一点我尝试将类组件转换为函数组件但我仍然遇到一些错误这是作为类编写的原始工作组件 import React Component from react import NavBar fro
Restkit：迁移到 0.20

我正在尝试迁移到 RestKit 0 20 pre2 目前我设法迁移我的映射至少编译器不再抱怨但我在创建请求时遇到问题之前我使用了不再存在的 RKObjectLoader 我之前的代码如下 RKObjectLoader objectL
如何从 Cassandra 获取排序计数器

我有一排计数器我想让它的列按值排序有什么策略或数据模型吗恐怕没有办法让 Cassandra 为你做这件事您需要从 Cassandra 获取整行对大行进行分页并在客户端中对其进行排序如果您的解决方案可以处理非最新结果您可以使用
R 中的 na.strings = c()

我是 R 新手并开始探索na strings c 函数与read csv 我已经读到使用此选项所有缺失的值将被替换为 NA 但我在我的文件中没有看到这种情况发生尽管使用了但我没有看到输出有任何差异na strings c 如果我遗漏
如何删除由 addEventListener 以事件对象作为参数绑定的匿名函数

例如 document addEventListener keyup function ev if ev ctrlKey dosomething false 有什么办法可以去掉匿名函数吗你可以自己写一个小接口addEventListene
tinymce 4 如何添加事件处理程序

在tinymce 3中我们似乎可以这样做 Adds a click handler to the current document tinymce dom Event add document click function e conso
Angular：延迟加载模块重新加载时重置服务状态

我的申请中关于服务的结构如下 AppModule AppComponent and HomeComponent Lazy1 Lazy2 Lazy3 我的应用程序从 AppComponent 开始它重定向到 HomeComponent 然后
正则表达式不以数字开头

如何创建一个匹配所有开头不带数字的字母数字的正则表达式现在我有 0 9 a zA Z0 9 例如 1ab 不匹配 ab1 匹配 1 bc 不匹配 bc 1 匹配你所写的内容存在三处错误首先要否定一个字符类您可以将 inside括号
雪花中有保存或加载工作表的选项吗？

雪花中有保存或加载工作表的选项吗或者将工作表下载到本地并从本地加载我的意思不是通过剪贴板将其粘贴到某些文本编辑器并保存这样的选项 Snowflake 会自动保存您的工作表您还可以将脚本从本地加载到工作表但是无法下载工作表 Saved
QOpenGLWidget显示黑屏

我尝试了此处描述的 QOpenGLWidget 示例 https stackoverflow com a 31524956 4564882 https stackoverflow com a 31524956 4564882 但我只得到一个
使用IDLE时的工作目录是什么？

所以我正在学习 Python 想创建一个简单的脚本来从互联网下载文件然后将其写入文件但是我正在使用 IDLE 并且不知道 IDLE 中的工作目录是什么或如何更改它如果我不知道工作目录或如何更改它如何在 IDLE 中执行文件系统操
如何识别“hw.machine”标识符可靠？

我正在寻找最官方的来源来完成维护此方法 NSString platformString NSString platform self platform if platform isEqualToString iPhone1 1 retur
如何获取 Woocommerce 电子邮件通知中的 cookie 值？

我正在使用 php cookie 从插件检索 woocommerce 感谢页面和客户订单详细信息页面的值它在感谢页面上工作正常但没有在电子邮件订单详细信息页面上打印任何内容我该如何解决此问题我尝试过使用 php 会话获取值它仅打印
itextsharp - 阅读 1 列（第 1 页）和 2 列（第 2 页）的 PDF 时出现问题

当打开首页上只有一列而其他页面上有超过一列的 PDF 文件时我的下面的代码丢失了有人可以告诉我我做错了什么吗下面是我的代码 PdfReader pdfreader new PdfReader pathNmArq ITextExtrac

itextsharp - 阅读 1 列（第 1 页）和 2 列（第 2 页）的 PDF 时出现问题

itextsharp - 阅读 1 列（第 1 页）和 2 列（第 2 页）的 PDF 时出现问题 的相关文章

随机推荐

热门标签

itextsharp - 阅读 1 列（第 1 页）和 2 列（第 2 页）的 PDF 时出现问题的相关文章