使用 Apache poi 从 docx 获取文本样式

2023-12-15

我正在尝试从 MS docx 文件中获取样式信息,使用添加的样式(如粗体、斜体)编写文件内容没有问题。字体大小等,但读取文件内容并获取样式信息不太清楚。我尝试过使用 XWPFDocument,这个 API 似乎没有读取样式的能力。我现在正在尝试 XWPFWordExtractor,它看起来更有希望,但我仍然无法获取文本的样式信息。

我阅读的内容类型类似于以下内容。

“你好,这是加粗字体这是斜体文本这是粗斜体文本"

任何指向示例的指针都会很棒。


好的,根据 Gagravarr 的评论,解决方案如下,正是我想要的。所以基本上加格拉瓦尔回答了这个问题,但我不知道除了说它之外还应该给予他信任。

for (XWPFParagraph paragraph : docx.getParagraphs()) {
                int pos = 0;
                for (XWPFRun run : paragraph.getRuns()) {
                    System.out.println("Current run IsBold : " + run.isBold());
                    System.out.println("Current run IsItalic : " + run.isItalic());
                    for (char c : run.text().toCharArray()) {

                        System.out.print(c);
                        pos++;
                    }
                    System.out.println();
                }
            }

`

输出如下

Current run IsBold : false Current run IsItalic : false "Hello, this is  Current run IsBold : true Current run IsItalic : false bold text Current run IsBold : false Current run IsItalic : false  and this is  Current run IsBold : false Current run IsItalic : true italic text Current run IsBold : false Current run IsItalic : false  a Current run IsBold : false Current run IsItalic : false n Current run IsBold : false Current run IsItalic : false d this is  Current run IsBold : true Current run IsItalic : true bold-italic text Current run IsBold : false Current run IsItalic : false "

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Apache poi 从 docx 获取文本样式 的相关文章

随机推荐

  • SendInput VB 基本示例

    我希望有人可以提供帮助 我试图找到模拟键盘命令的 SendInput 代码的示例 我希望找到记事本窗口并输入测试消息 我最初在我正在从事的一个项目中使用 SendKeys SendKeys 功能使我能够将键盘命令转发到我们在工作场所使用的定
  • Google App Engine NDB:如何存储文档结构?

    来自 App Engine NDB文档 NDB API 在无模式对象中提供持久存储 数据存储 它支持自动缓存 复杂的查询和 原子交易 NDB 非常适合存储结构化数据 记录 我想使用 NDB 创建如下结构 其中每个实例如下所示 city SF
  • lex 有问题

    我的lex如下 LNUM 0 9 DNUM 0 9 0 9 0 9 0 9 LNUM printf t ECHO printf r n DNUM printf t ECHO printf r n 但事实证明它只能匹配像这样的数字4 12 2
  • 安装 mpi4py

    我正在尝试在我的 Linux 机器上安装 mpi4py 我最近安装了 anaconda 4 1 1 根据他们的文档 该软件包应该附带 mpi4py 2 0 0 当我尝试用 验证 时conda list 我在列表中找不到该包 我努力了 pip
  • 如何通过Socket发送字符串数组对象?

    我有字符串数组对象 可以说 String names new String 7 我还通过在客户端系统上使用 ObjectOutputStream 将其存储到文件中来使该对象持久化 我正在使用 ObjectInputStream 读取存储的对
  • 使用 JavaScript 进行表单验证

    我正在尝试使用 JavaScript 验证表单 但我有点坚持在字段旁边显示一条消息说 此字段是必需的 我该怎么做呢 抱歉 我对 JavaScript 很陌生 这是我的js代码 var allFieldsRequired true funct
  • iOS 9 / Xcode 7 上的 SpriteKit 场景屏幕偏移

    我将一个 SpriteKit 项目从 Xcode64 移动到 Xcode7 在 iOS9 模拟器中运行它 屏幕内容发生了变化 在iOS8模拟器中运行时不会移位 iOS9模拟器截图 在Xcode7中缩放SpriteKit场景会以不同的中心缩放
  • 在 JBoss 上使用 Spring MVC Java Config 出现 404 错误

    我使用 Java Config 编写了一个小型 Spring MVC 应用程序 它在 Tomcat 上工作得很好 但在 JBoss EAP 6 2 上却不行 它已成功部署在 JBoss 上 但当我请求 Spring MVC 定义的任何页面和
  • Durandal 2.0 自定义对话框

    我希望制作一个 Durandal 自定义对话框 在现有的可组合视图模型周围添加一个带有标题和页脚的窗口框架 我制作了一个 customModal html 模板 div class messageBox div class modal he
  • Wordpress AJAX 不起作用 - 响应 0

    我想为我的插件添加 AJAX 支持 但我对这个简单的事情有很大的问题 WordPress 不允许我使用普通 AJAX 我需要使用 WordPress 版本 在任何时候 WordPress 函数 应该生成输出 都会返回 0 我认为原因是 WP
  • 为什么我会收到SettingWithCopyWarning a value is试图在切片副本上设置的警告? [复制]

    这个问题在这里已经有答案了 运行以下代码时 import pandas as pd df pd DataFrame A 1 2 3 B 2 4 8 df2 df df A lt 3 df2 C 100 我收到以下警告 SettingsWit
  • 在内存有限的情况下,如何优雅地降低性能?

    过去几天我一直在尝试消除游戏中的内存泄漏 从而导致许多内存不足错误 我即将添加大量图形 虽然不是非常复杂 但会显着增加系统的处理要求 而且我有点担心我的内存使用情况 我希望有人可能有给我一些建议 我不想低于 Android 2 1 所以请为
  • 如何动态更改Viewpager选项卡颜色?

    如何像这样改变标签的颜色 当我单击 滑动到绿色或任何其他选项卡时 选项卡颜色应更改为适当的颜色 其余其他选项卡颜色应更改为黑色 我怎样才能做到这一点 我正在使用 Viewpager 我在 onpagelistener 中尝试了这段代码 if
  • Java - .Net 对象交换,不基于 Web

    我有一个用 C 实现的客户端 服务器系统 客户端和服务器通过序列化 反序列化交换 Net 对象并通过 TCP IP 进行通信 它在本地网络上运行 不是基于 Web 或基于 Internet 现在我想包括通过 wifi 连接的 Android
  • 如何将透视变换应用于 UIView?

    我正在寻找对 UIView 执行透视变换 例如在 coverflow 中看到的 有谁知道这是否可能 我调查过使用CALayer并浏览了所有务实程序员的核心动画播客 但我仍然不清楚如何在 iPhone 上创建这种转换 任何帮助 指示或示例代码
  • 未捕获的错误:未找到“App\Kernel”类

    当我想运行任何 php bin console 命令时 我目前面临一个重要问题 Symfony Component ErrorHandler Error ClassNotFoundError 29 message Attempted to
  • 使大型处理工作变得更小

    这是我在寻找解决方案时使用的代码 public function indexAction id3 options options array version gt 3 0 encoding gt Zend Media Id3 Encodin
  • 我可以确定当前的测试执行人员是来自测试实验室还是来自 QTP IDE 中的交互式测试?

    检查当前 QTP 测试执行是否是交互式的 即不是从 QC 测试实验室启动的 QC 测试集执行的一部分 的最有效方法是什么 你们知道一个很酷的方法吗 WR 曾经有一个批处理运行标志 对于 IDE 内的所有执行 该标志都会被可靠地清除 也许QT
  • Bootstrap 4 - 粘性页脚 - 动态页脚高度

    我需要在我的页面上放置一个粘性页脚 但是我没有为页脚设置明确的高度 在较小的屏幕上 行的大小会调整 页脚会变长 因此 getbootstrap 上提供的默认粘性页脚示例不起作用 因为它需要固定的页脚高度 有什么方法可以实现这个吗 Stick
  • 使用 Apache poi 从 docx 获取文本样式

    我正在尝试从 MS docx 文件中获取样式信息 使用添加的样式 如粗体 斜体 编写文件内容没有问题 字体大小等 但读取文件内容并获取样式信息不太清楚 我尝试过使用 XWPFDocument 这个 API 似乎没有读取样式的能力 我现在正在