我正在尝试从 MS docx 文件中获取样式信息,使用添加的样式(如粗体、斜体)编写文件内容没有问题。字体大小等,但读取文件内容并获取样式信息不太清楚。我尝试过使用 XWPFDocument,这个 API 似乎没有读取样式的能力。我现在正在尝试 XWPFWordExtractor,它看起来更有希望,但我仍然无法获取文本的样式信息。
我阅读的内容类型类似于以下内容。
“你好,这是加粗字体这是斜体文本这是粗斜体文本"
任何指向示例的指针都会很棒。
好的,根据 Gagravarr 的评论,解决方案如下,正是我想要的。所以基本上加格拉瓦尔回答了这个问题,但我不知道除了说它之外还应该给予他信任。
for (XWPFParagraph paragraph : docx.getParagraphs()) {
int pos = 0;
for (XWPFRun run : paragraph.getRuns()) {
System.out.println("Current run IsBold : " + run.isBold());
System.out.println("Current run IsItalic : " + run.isItalic());
for (char c : run.text().toCharArray()) {
System.out.print(c);
pos++;
}
System.out.println();
}
}
`
输出如下
Current run IsBold : false
Current run IsItalic : false
"Hello, this is
Current run IsBold : true
Current run IsItalic : false
bold text
Current run IsBold : false
Current run IsItalic : false
and this is
Current run IsBold : false
Current run IsItalic : true
italic text
Current run IsBold : false
Current run IsItalic : false
a
Current run IsBold : false
Current run IsItalic : false
n
Current run IsBold : false
Current run IsItalic : false
d this is
Current run IsBold : true
Current run IsItalic : true
bold-italic text
Current run IsBold : false
Current run IsItalic : false
"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)