使用 PDFBox 从字符串中删除非法字符

2024-02-05

当我尝试向 PDF 中写入非法字符时，我显然遇到了异常。例如。

contentStream.showText("some illegal characters");    
...
java.lang.IllegalArgumentException: U+000A ('controlLF') is not available in this font Helvetica (generic: ArialMT) encoding: WinAnsiEncoding...

如何找出不支持哪些字符并将它们从字符串中删除？

这是我的解决方案...至少它适合我的需要。我使用PDFBox的WinAnsiEncoding类并调用contains方法来检查该字符是否受支持。

import org.apache.pdfbox.pdmodel.font.encoding.WinAnsiEncoding;

public class Test extends WinAnsiEncoding {

    public static String remove(String test) {
        StringBuilder b = new StringBuilder();
        for (int i = 0; i < test.length(); i++) {
            if (WinAnsiEncoding.INSTANCE.contains(test.charAt(i))) {
                b.append(test.charAt(i));
            }
        }
        return b.toString();
    }

    public static void main(String[] args) {
        System.out.println(remove("abc\rcde"));
        // prints abccde
    }

}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

PDFBox

使用 PDFBox 从字符串中删除非法字符的相关文章

获取文件的锁

我想在对特定文件开始 threo read 时获取文件上的锁定以便其他应用程序无法读取已锁定的文件并希望在线程终止时释放锁定文件您可以获得一个FileLock https docs oracle com javase 8 docs ap
如何强制jar使用（或jar运行的jvm）utf-8而不是系统的默认编码

我的Windows默认编码是GBK 而我的Eclipse完全是utf 8编码因此在我的 Eclipse 中运行良好的应用程序崩溃了因为导出为 jar 文件时这些单词变得不可读我必须在 bat 文件中写入以下行才能运行该应用程序 st
如何将jscrollpane添加到jframe？

我有以下源代码有人可以给我建议如何将 jscrollpane 添加到 jframe 上吗我尝试了几次将其添加到 jframe 但没有任何进展它甚至没有显示 public class Form3 JFrame jframe new JF
删除优先级队列的尾部元素

如何删除优先级队列的尾部元素我正在尝试使用优先级队列实现波束搜索一旦优先级队列已满我想删除最后一个元素优先级最低的元素 Thanks 没有简单的方法将元素从原始元素复制到新元素最后一个除外 PriorityQueue remov
为自定义驱动程序创建 GraphicsDevice

我正在开发一个在嵌入式系统中使用 Java 的项目我有用于屏幕和触摸输入的驱动程序以及用于文本输入的虚拟键盘我的屏幕驱动程序有一个Graphics2D您可以绘制的对象和repaint Rectangle 更新方法类似地触摸驱动器能
为什么 MOVE CURSOR 在 OS X Mountain Lion 上不显示？

我正在做一个项目想看看 Swing 提供的每个光标是什么样子的 public class Test public static void main String args JFrame frame new JFrame frame set
如何检测图像是否像素化

之前有人在 SO 上提出过这样的问题在Python中检测像素化图像 https stackoverflow com questions 12942365 detecting a pixelated image in python还有关于q
Java中的断点和逐步调试？

抱歉我的问题名称很奇怪我不知道如何寻找这个因为我不知道这些东西是如何称呼的 Visual Studio 中至少有一个功能您可以单击代码左侧并设置一个大红点的起点然后运行程序您可以通过按 f8 或 f5 实际上是不同的 f 来跟踪步
是否可以从 servlet 内部以编程方式设置请求上下文路径？

这是一个特殊情况我陷入了处理企业网络应用程序的困境企业应用程序正在调用request getContext 并将其与另一个字符串进行比较我发现我可以使用 getServletContext getContextPath 获取 se
如何通过注解用try-catch包装方法？

如果应该在方法调用中忽略异常则可以编写以下内容 public void addEntryIfPresent String key Dto dto try Map
当 minifyEnabled 为 true 时 Android 应用程序崩溃

我正在使用多模块应用程序并且该应用程序崩溃时minifyEnabled true in the installed模块的build gradle 以下是从游戏控制台检索到的反混淆堆栈跟踪 FATAL EXCEPTION Controlle
Spring Data JPA：查询如何返回非实体对象或对象列表？

我在我的项目中使用 Spring Data JPA 我正在演奏数百万张唱片我有一个要求我必须获取各种表的数据并构建一个对象然后将其绘制在 UI 上现在如何实现我的 Spring 数据存储库我读到它可以通过命名本机查询来实现如果指
无法在 Java/Apache HttpClient 中处理带有垂直/管道栏的 url

例如如果我想处理这个网址 post new HttpPost http testurl com lists lprocess action LoadList 401814 1 Java Apache 不允许我这么做因为它说竖线是非法的
避免 Java 中的重复导入：继承导入？

有没有办法继承导入 Example 常见枚举 public enum Constant ONE TWO THREE 使用此枚举的基类 public class Base protected void register Constant
替换文件中的字符串

我正在寻找一种方法来替换文件中的字符串而不将整个文件读入内存通常我会使用 Reader 和 Writer 即如下所示 public static void replace String oldstring String newstring
使用 Java https 上传到 Imgur v3 错误

我目前正在尝试使用他们当前的 API v3 上传到 imgur 但是我不断收到错误错误 javax net ssl SSLException 证书中的主机名不匹配 api imgur com imgur com OR imgur com
ECDH使用Android KeyStore生成私钥

我正在尝试使用 Android KeyStore Provider 生成的私有文件在 Android 中实现 ECDH public byte ecdh PublicKey otherPubKey throws Exception try
何时在 hibernate 中使用 DiscriminatorValue 注解

在 hibernate 中使用 DiscriminatorValue 注释的最佳场景是什么以及何时这两个链接最能帮助我理解继承概念 http docs oracle com javaee 6 tutorial doc bnbqn html
HttpClient请求设置属性问题

我使用这个 HttpClient 库玩了一段时间几周我想以某种方式将属性设置为请求不是参数而是属性在我的 servlet 中我想使用 Integer inte Integer request getAttribute obj 我不
记录类名、方法名和行号的性能影响

我正在我的 java 应用程序中实现日志记录以便我可以调试应用程序投入生产后可能出现的潜在问题考虑到在这种情况下人们不会奢侈地使用 IDE 开发工具以调试模式运行事物或单步执行完整代码因此在每条消息中记录类名方法名和行号将非常有

随机推荐

如何在 OpenGL 中对 glutSolidTorus 进行纹理处理？ [关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我正在尝试纹理glutSolidTorus 这是我的代码 glColor3f 1 0f 1 0f 1 0f glEnab
UIButton 垂直对齐不起作用

我不明白为什么在下面的代码中标题对齐没有保持在顶部 UIButton btn2 UIButton buttonWithType UIButtonTypeRoundedRect btn2 titleLabel font UIFont sys
编辑主键

如果表只包含主键字段是否可以在 MVC3 中编辑主键例如我有一个控制台表其中我将控制台名称作为主键我希望能够编辑它并更改它并保存编辑后的值如果您需要更多信息请告诉我作为一般规则您永远不应该编辑主键 SQL Server 中
Jquery：如何向 mouseleave 添加延迟，以便如果有人无意间将鼠标悬停在元素上，它仍然保持打开状态

悬停意图插件与我需要的相反我有一个由 trigger 触发的 popup 当我将鼠标悬停在其上时我希望 popup 在几秒钟内不淡出但如果我将鼠标悬停然后再次悬停则取消将要发生的淡出并保持 popup 打开有谁知道我会怎么做这
反应式扩展超时不会停止序列？

我正在尝试做一个IObservable
为我的数据库 mysql 中的每一行调用 php 脚本

如果这是一个愚蠢的问题我很抱歉但我现在不知道如何为表中的每一行调用 php 脚本我正在使用mysql 我以后会使用PDO 我知道它更好这是我的选择页面我在其中选择所需的行
Printer_open() 打印 html 输出

With printer open php 中的函数我可以打印我保存的字符串 content变量并且能够从文件打印 printer Pserver php net printername handler printer open pri
插入缺失的日期行并在新行中插入旧值 PySpark

我有一个 DataFrame 其中包含一个人一个体重和时间戳如下所示 person timestamp weight 1 2019 12 02 14 54 17 49 94 1 2019 12 03 08 58 39 50 49 1 2
如何在 ASP.net 控制器操作中访问整个查询字符串

我知道如果我有一个像 XController Action id 1 这样的 url 和一个操作方法 void Action int id id 参数将自动从查询字符串中读取但是当我事先不知道所有参数的名称时如何访问整个查询字符串例
哪个版本的 Xcode 支持 iOS 12.2？

当我在运行 iOS 12 2 的 iPhone 7 上运行我自己开发的软件时弹出了一个警报这款 iPhone 7 型号 1660 1778 1779 1780 运行的是 iOS 12 2 16E5201e 此版本的 Xcode 可能不支
SQL Server 用最后一个值替换 NULL [重复]

这个问题在这里已经有答案了我想找到一种方法用最后一个非 NULL 值替换 NULL 值我有一张像这样的桌子 Date Cost 2017 01 01 18 6046511 2017 01 03 22 9787234 2017 01 03
oracle 限制为 1000 / hibernate

Oracle 知道 1000 个元素的限制where a in 条款当 Hibernate 与 Oracle 结合使用时是否也存在此限制 Hibernate 中仍然存在此数据库限制如果您确实需要在 in 子句中包含超过 1000 个项
关于模板专业化和继承的良好实践

模板专业化不考虑继承层次结构例如如果我专门设计一个模板Base并实例化它Derived 不会选择专业参见下面的代码 1 这可能是一个主要障碍因为它有时会导致违反里氏替换原则例如在工作时这个问题 https stackoverfl
python：安装anaconda后，如何导入pandas

我已经安装了蟒蛇现在当我尝试跑步时 import pandas as pd 我收到以下错误 Traceback most recent call last File
Python 中的词法分析、标记化和解析资源

人们可以向我指出有关使用 Python 进行词法分析解析和标记化的资源吗我正在对一个开源项目进行一些黑客攻击 hotwire http www hotwire shell org 并想对代码进行一些更改lexes http code g
Poco C++ 库和 Win32 GUI 集成

有人曾经在 Win32 GUI 应用程序中使用过 Poco C 库吗在 PocoFoundation 库中 UnWindows h 头文件中的许多 undef 禁止使用重要的 API 如 CreateWindows LoadLibrary
从tensorflow.js神经网络获取权重

我有这个顺序模型 this model tf sequential this model add tf layers dense units 16 useBias true inputDim 7 input this model add t
使用 XMLInputFormat 在 hadoop 中解析 xml 时不执行我的 hadoop 映射器类

我是 hadoop 新手使用 Hadoop 2 6 0 版本并尝试解析复杂的 XML 经过一段时间的搜索我了解到对于 XML 解析我们需要编写自定义的 InputFormat 即 mahout 的 XMLInputFormat 我也
如何将图像拖放到 HTML5 Canvas 上？

我修改了一个页面可以将图像拖放到画布上它可以做我想要的一切除了一个我尝试了多种方法包括脚本例如 Kinetic 和 Raphael 我仍然认为这可能是可行的方法但已经死了一旦图像被放下我就无法将其在画布上拖动到新位置 fu
使用 PDFBox 从字符串中删除非法字符

当我尝试向 PDF 中写入非法字符时我显然遇到了异常例如 contentStream showText some illegal characters java lang IllegalArgumentException U 000A

使用 PDFBox 从字符串中删除非法字符

使用 PDFBox 从字符串中删除非法字符 的相关文章

随机推荐

热门标签

使用 PDFBox 从字符串中删除非法字符的相关文章