将 XWPFRun 拆分为多个运行

2024-02-13

我正在尝试修改existingWord 文档自动将其中的某些关键字加粗。举个例子：

敏捷的棕色狐狸跳过了懒狗。 (1)

会成为：

快速棕色fox跳过懒惰者dog. (2)

我的问题是 (1) 是一次运行，(2) 变成 5 次运行（5 作为狗后面的句点不是粗体，但它是一个细节）。我得到了多次运行。完全没问题。

问题#1：

有没有一种方法可以轻松地将同一段落中的一个运行拆分为多个运行？我没能做到。

问题2：

由于我无法分割运行，因此我尝试创建一个新段落，但它确实不理想并将运行添加到其中。我已经成功地完全复制了一个段落并修改了重复段落中的运行，我保留了样式（这是预期的），但我丢失了重复段落中的注释。

理想情况下，我想就地分割运行（在段落内），但如果不可能有一个更好的克隆器：

  public static void cloneRun(XWPFRun source, XWPFRun clone) {
    CTRPr rPr = clone.getCTR().isSetRPr()
        ? clone.getCTR().getRPr()
        : clone.getCTR().addNewRPr();
    rPr.set(source.getCTR().getRPr());
    clone.setText(source.getText(0));
  }

In 如何使用 apache poi 更改特定 Word 文档的颜色？ https://stackoverflow.com/questions/40318507/how-do-i-change-color-of-a-particular-word-document-using-apache-poi/40327308#40327308我已经展示了一种分割算法XWPFRuns出于格式原因。这仅用于格式化一个字符，并且不会克隆运行属性。但基本的已经显示出来了。我们必须查看整个段落，因为只有插入运行的方法。我们需要按字符循环运行文本，因为所有拆分为单词的方法都会导致标点符号出现问题，然后将单词重新组装成段落。

缺少的是一种将运行属性从原始运行克隆到新添加的运行属性的方法。这可以通过克隆底层来完成w:rPr元素。

然后整个方法就是遍历段落中的所有运行。如果我们有一个包含关键字的运行，则将运行文本拆分为字符。然后遍历该运行中的所有字符并缓冲它们。如果缓冲的字符流以关键字结尾，则将当前缓冲的除关键字之外的所有字符设置为实际运行的文本。然后为格式化关键字插入新的运行，并从原始运行克隆运行属性。将关键字设置到运行中并进行附加格式化。然后为下一个字符插入一个新的运行，并从原始运行中克隆运行属性。对于该段落中的每次运行，依此类推。

完整示例：

import java.io.*;
import org.apache.poi.xwpf.usermodel.*;
import org.openxmlformats.schemas.wordprocessingml.x2006.main.*;

import org.apache.xmlbeans.XmlObject;
import org.apache.xmlbeans.XmlCursor;

import java.util.*;
import java.awt.Desktop;

public class WordFormatWords {

 static void cloneRunProperties(XWPFRun source, XWPFRun dest) { // clones the underlying w:rPr element
  CTR tRSource = source.getCTR();
  CTRPr rPrSource = tRSource.getRPr();
  if (rPrSource != null) {
   CTRPr rPrDest = (CTRPr)rPrSource.copy();
   CTR tRDest = dest.getCTR();
   tRDest.setRPr(rPrDest);
  }
 }

 static void formatWord(XWPFParagraph paragraph, String keyword, Map<String, String> formats) {
  int runNumber = 0;
  while (runNumber < paragraph.getRuns().size()) { //go through all runs, we cannot use for each since we will possibly insert new runs
   XWPFRun run = paragraph.getRuns().get(runNumber);
   XWPFRun run2 = run;
   String runText = run.getText(0);
   if (runText != null && runText.contains(keyword)) { //if we have a run with keyword in it, then

    // This code part is to manage comment ranges.
    // Do we have commentRangeEnd immediately after the run?
    // If so then remember that in a cursor.
    XmlCursor commentRangeEndCursor = null; 
    XmlCursor cursor = run.getCTR().newCursor();
    cursor.toEndToken();
    if (cursor.hasNextToken()) {
     cursor.toNextToken();
     XmlObject commentRangeEnd = cursor.getObject();
     if (commentRangeEnd != null && commentRangeEnd instanceof CTMarkupRange) {
      commentRangeEndCursor = cursor;
     }
    }

    char[] runChars = runText.toCharArray(); //split run text into characters
    StringBuffer sb = new StringBuffer();
    for (int charNumber = 0; charNumber < runChars.length; charNumber++) { //go through all characters in that run
     sb.append(runChars[charNumber]); //buffer all characters
     runText = sb.toString();
     if (runText.endsWith(keyword)) { //if the bufferend character stream ends with the keyword  
      //set all chars, which are current buffered, except the keyword, as the text of the actual run
      run.setText(runText.substring(0, runText.length() - keyword.length()), 0); 
      run2 = paragraph.insertNewRun(++runNumber); //insert new run for the formatted keyword
      cloneRunProperties(run, run2); // clone the run properties from original run
      run2.setText(keyword, 0); // set the keyword in run
      for (String toSet : formats.keySet()) { // do the additional formatting
       if ("color".equals(toSet)) {
        run2.setColor(formats.get(toSet));
       } else if ("bold".equals(toSet)) {
        run2.setBold(Boolean.valueOf(formats.get(toSet)));
       }
      }
      run2 = paragraph.insertNewRun(++runNumber); //insert a new run for the next characters
      cloneRunProperties(run, run2); // clone the run properties from original run
      run = run2;
      sb = new StringBuffer(); //empty the buffer
     } 
    }
    run.setText(sb.toString(), 0); //set all characters, which are currently buffered, as the text of the actual run

    // This code part is to manage comment ranges.
    // If we had remembered commentRangeEnd, then move this to here now.
    if(commentRangeEndCursor != null) {
     cursor = run.getCTR().newCursor();
     cursor.toEndToken();
     if (cursor.hasNextToken()) {
      cursor.toNextToken();
      commentRangeEndCursor.moveXml(cursor);
     }
     cursor.dispose();
     commentRangeEndCursor.dispose();
    }

   }
   runNumber++;
  }
 }


 public static void main(String[] args) throws Exception {

  XWPFDocument doc = new XWPFDocument(new FileInputStream("source.docx"));

  String[] keywords = new String[]{"fox", "dog"};
  Map<String, String> formats = new HashMap<String, String>();
  formats.put("bold", "true");
  formats.put("color", "DC143C");

  for (XWPFParagraph paragraph : doc.getParagraphs()) { //go through all paragraphs
   for (String keyword : keywords) {
    formatWord(paragraph, keyword, formats);
   }
  }

  FileOutputStream out = new FileOutputStream("result.docx");
  doc.write(out);
  out.close();
  doc.close();

  System.out.println("Done");
  Desktop.getDesktop().open(new File("result.docx"));

 }
}

这段代码还关心XML标记范围元素，例如commentRangeEnd紧接着跑步之后r元素。此类标记范围元素用于标记其他元素组的开始和结束。例如，应用注释的一组文本运行元素位于commentRangeStart and commentRangeEnd具有相同的id.

如果在需要分割的运行之后立即跟随commentRangeEnd，然后我们在光标中记住它。然后在分割运行后我们移动这个commentRangeEnd紧接着最后一个新插入的运行。所以评论应该保持正确。

当然，即使这样也会有一些缺点，因为方法很笨拙。Microsoft Word有时将文本存储在文本运行中。对于这个问题，没有唯一的通用解决方案Microsoft Word是源头。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 XWPFRun 拆分为多个运行的相关文章

jvm中本机代码如何转换为机器代码[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我读过一些文章说 jvm将字节码转换为机器码 jvm将字节码转换为本机代码 jvm 将字节码转换为系统调用系统调用又由操作系统与硬件
Java 流 - 按嵌套列表分组（按第二顺序列出）

我有以下数据结构每个学生都有一个州列表每个州都有一个城市列表 public class Student private int id private String name private List
帮助我避免 JPA、Hibernate 和 MySQL 的连接超时

我正在使用 JPA Hibernate 作为提供者 Glassfish 和 MySQL 开发中一切都运行良好但是当我将应用程序部署到测试服务器并让它运行大部分空闲过夜时我通常会在早上遇到这样的情况 2011 03 09T15 06
Glassfish：在部署期间修改 EAR 的部署描述符

经过几天的搜索尝试和摇头我将这个问题发布到 SO 尽管它seems已经得到答复这是场景我有一个 EAR 应用程序目前包含一个 WAR 和一个 EJB 模块 EJB 模块使用 JPA persistence xml 并且一些无状态
如何将抽象工厂与单例模式结合起来？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在用 java 编码并且对这些模式很陌生谁能给我一个也使用单例的工厂抽象的例子这是一个实现类的示例单例模式这个实现也是线程安全
ResultSet：通过索引检索列值与通过标签检索

使用 JDBC 时我经常遇到这样的结构 ResultSet rs ps executeQuery while rs next int id rs getInt 1 Some other actions 我问自己以及代码作者为什么不使用
AffineTransform.rotate() - 如何同时缩放、旋转和缩放？

我有以下代码它可以完成我想要绘制一个上面有一些棋子的棋盘的第一部分 Image pieceImage getImage currentPiece int pieceHeight pieceImage getHeight null dou
c和java语言中的换行符

现在行分隔符取决于系统但在 C 程序中我使用 n 作为行分隔符无论我在 Windows 还是 Linux 中运行它都可以正常工作为什么在java中我们必须使用 n 因为它与系统相关那么为什么我们在c中使用 n 作为新行而不管我
EMF Eclipse：带有自定义字段（属性）的枚举

好吧在 Java 中这是可能的 import org eclipse emf common util Enumerator public enum MyEnum implements Enumerator LITERAL1 0 Name
按文件名过滤 eclipse 中的警告

我们使用 Eclipse 进行 Java 开发并使用 Maven 将 JSP 编译成 servlet 以便在嵌入式 Jetty 实例中使用这意味着要从 Eclipse 运行该项目我必须包含 target jsp source 作为源文
Java 中的 MP4 容器编写器

我想找到一个免费的 Java MP4 容器编写器我不需要编码器只需要能够根据预期值写入正确原子的编码器 Bonus对于这样一个库也可以编写有效 F4V 我更喜欢纯 Java 解决方案而不是使用 JNI 或外部可执行文件的解决方案
为什么我要使用责任链而不是 switch 语句

考虑一下您已经获得了多次验证仅当要检查的对象属于某种类型时这些验证才应生效为什么我要使用责任链而不是 switch 语句责任链示例 public class Executor Inject private ValidatorFact
如何使用 Selenium 中的索引切换到窗口

由于selenium不提供切换到窗口多个窗口的方法但我想使用index html自定义方法来切换到不同的窗口但下面的代码没有按预期工作请建议以下方法的最佳实施 public void switchToWindowIndex int
JFrame Glasspane 也优于 JDialog，但不应该

我有一个带有 Glasspane 的 JFrame 未装饰该框架打开一个 JDialog 也未装饰也有一个 glassPane 并隐藏自身 setVisible false Glasspanes 通过 setGlassPane 设置对
如何列出hadoop hdfs中目录及其子目录中的所有文件

我在 hdfs 中有一个文件夹其中有两个子文件夹每个子文件夹大约有 30 个子文件夹最后每个子文件夹都包含 xml 文件我想列出所有 xml 文件仅给出主文件夹的路径在本地我可以这样做apache commons io 的 h
javax.xml.bind.JAXBException: 类 *** 及其任何超类在此上下文中均未知

我正在尝试通过 REST Web 服务传递对象以下是我的课程使用一些示例代码解释了我需要的功能 Rest Web 服务类方法 POST Path find Consumes MediaType APPLICATION FORM URLE
如何在 Log4j2 - JSON 布局中自定义或删除默认属性

In Spring Boot 2我已配置的应用程序Log4j2 with JsonLayout像下面这样
AndroidAnnotations 和 Dagger

我正在尝试使用 Dagger 注入 Android 带注释的 Activity java lang IllegalArgumentException No inject registered for members com app serv
在没有EOF的情况下停止读取java中的输入

In 问题如何停止读取输入我的程序继续运行要求更多输入 public static void main String args throws Exception BufferedReader br new BufferedReader
使用 PDFBox 在 Android 中创建 PDF

我正在尝试通过我的 Android 应用程序创建 PDFPDFBoxapi 但出现以下错误 java lang NoClassDefFoundError org apache pdfbox pdmodel PDDocument 我已经将以下

随机推荐

ISO 8601 中的时间戳 - 最后 6 位数字 yyyy-MM-dd'T'HH:mm:ss。

我的时间戳看起来像这样 2015 03 21T11 08 14 859831 2015 03 21T11 07 22 956087 我读了一篇关于 ISO 8601 的 Wiki 文章 https en wikipedia org wiki
pandas - 计算另一列中每个唯一值的 DataFrame 中值的出现次数

假设我有一个数据帧 term score 0 this 0 1 that 1 2 the other 3 3 something 2 4 anything 1 5 the other 2 6 that 2 7 this 0 8 someth
MySQL按日期分组的累积和

我知道有一些与此相关的帖子但我的情况有点不同我想在这方面获得一些帮助我需要从数据库中提取一些数据这些数据是每天交互的累积计数目前这就是我所拥有的 SELECT e Date AS e date count e ID AS num
如何将 dll 导入到在网络服务器上运行的 ASP.NET Web 应用程序中

我在 VS 2010 中创建了一个 dll 我将其放入网络服务器上的 app code 文件夹中然后我通过尝试使用来访问它imports GetWebPageData 如果这意味着什么的话 dll 位于 bin debug 下的 vs 项
如何在Java中的不同类中使用相同的对象

假设我有 3 个 java 类 A B 和 C 我需要创建一个在 A 和 B 中都使用的 C 类对象但单独创建该对象的问题是类 c 的构造函数被调用了 2 次但我希望构造函数只被调用一次所以我想将A类中创建的对象使用到B类中因此创
如何从 Web api 控制器返回文件？

我正在使用 MVC 5 Web Api 控制器我想返回一个文件 Route public HttpResponseMessage GetFile var statusCode HttpStatusCode OK FileStream fi
jQuery 倒计时有问题吗？函数serverSync：服务器时间

serverSync serverTime函数从服务器返回值但我检查了服务器和客户端时间是否相同当我调用服务器与服务器同步时它不会显示倒计时帮我 function var shortly new Date var newTime n
SQL更新记录，每次从1开始递增值

我使用单个插入语句将批量记录添加到表中我希望为每个新批次分配递增的数字但每次都从 1 开始所以如果我有 Batch Name IncementingValue 1 Joe 1 1 Pete 2 1 Andy 3 2 Sue 1 2
Scrapy好像没有做DFO

我有一个网站我的爬虫需要遵循一定的顺序例如在开始进行 a2 之前它需要先进行 a1 b1 c1 等操作 a b 和 c 中的每一个都由不同的解析函数处理并且相应的 url 在 Request 对象中创建并生成下面粗略地说明了我正
不允许的参数嵌套属性 -rails

我正在尝试向 2 个表提交表单但不知何故我收到了此语法错误unexpected n 在这条线上joins sources landslide id and found unpermitted parameter sources在滑坡参数中
无法从 Sequel gem 连接 mysql

当我尝试从 Sequel 连接到 MySQL 时我收到这些错误 require rubygems require sequel DB Sequel connect adapter gt mysql user gt root host gt
DependencyProperty 未在 NotifyCollectionChanged 事件上通知 UI

我正在使用一个自定义控件该控件具有选定的项目依赖属性我已将其连接到集合更改事件但未通知 UI 并且 PropertyChanged 事件始终为空通常我会说这是一个数据上下文问题但我无法更改控件上的数据上下文因为不会显示任何数据
如何使用Matlab的bsxfun求解累加和

我有以下慢代码 A is n by m matrix B is n by m by d matrix C is n by m by d matrix R is 1 by d vector A zeros n m for i 1 d A
将 XML 实体保留在输出中 (jSoup)

我正在使用 jsoup 进行一些 xml 处理问题是它正在替换 xml 实体即 187 与 html 实体 raquo 我如何保留原始 xml 实体常规脚本 import org jsoup Jsoup import org jso
Vue 警告客户端渲染的虚拟 DOM 树与服务器渲染的内容不匹配

我正在尝试使用 Vue js 和 Nuxt 在表中循环 tr 但是当我加载页面时出现以下错误 vue runtime esm js 2b0e 619 Vue warn 客户端渲染虚拟 DOM 树与服务器渲染的内容不匹配这是可能是由不正
Eclipse 停止编译 RenderScript 文件

我的 Android 项目中有一个 RenderScript rs 文件 SomeScript rs 在我开发它的过程中它运行得很好但后来我在 Eclipse 中清理了工作区现在它似乎没有将该文件识别为 RenderScript 文件
Symfony：错误：尝试调用函数“ctype_digit”

我尝试在服务器上安装 Symfony 3 3 项目时遇到错误我正在使用 Apache HTTP 服务器和 PHP 7 0 当我访问 app dev php 时它显示该错误 UndefinedFunctionException Attem
如何删除旧的不需要的设备？

所以这与我之前发布的问题有关如何删除4 3模拟器 https stackoverflow com q 10834817 96716 我愚蠢地安装了 iOS 5 0 模拟器现在我上一篇文章中提供的技术不起作用了当您删除 5 0sdk 然
自定义语言的 Gradle 插件

我有一种自定义语言假设它是 MyLang 但它可以是任何语言我想为其制作一个插件该插件需要能够识别 DSL 给定语言的源集能够使用可执行文件编译器来编译它们我能够创建一个带有编译任务还为空的插件并使用 Language
将 XWPFRun 拆分为多个运行

我正在尝试修改existingWord 文档自动将其中的某些关键字加粗举个例子敏捷的棕色狐狸跳过了懒狗 1 会成为快速棕色fox跳过懒惰者dog 2 我的问题是 1 是一次运行 2 变成 5 次运行 5 作为狗后面的句点不是粗体但它

将 XWPFRun 拆分为多个运行

将 XWPFRun 拆分为多个运行 的相关文章

随机推荐

热门标签

将 XWPFRun 拆分为多个运行的相关文章