对多个区域使用 Matcher.appendReplacement()

2024-03-05

java Matcher.appendReplacement() 方法（带有appendTail()）应该让我将源文本转换为结果文本，同时替换所有出现的模式。伪语言的算法类似于：

while Matcher.find() {
  call Matcher.appendReplacement()
}
call Matcher.appendTail()

如果仅在给定区域内搜索模式，则一切都很好：

call Matcher.region()
while Matcher.find() {
  call Matcher.appendReplacement()
}
call Matcher.appendTail()

当在区域内匹配后，我想进一步移动该区域时，就会出现问题：

call Matcher.region()
while Matcher.find() {
  call Matcher.appendReplacement()
}
call Matcher.region()
while Matcher.find() {
  call Matcher.appendReplacement()
}
call Matcher.appendTail()

这不起作用，因为region()会重置匹配器，以便Matcher.appendReplacement()从文本的开头重新启动，导致结果包含源某些部分的重复。

正如 javadoc 所说，这是设计造成的。

替换可以位于多个区域内的模式的正确方法是什么？

编辑：添加了 java 示例，删除了文本示例

下面的 java 示例显示了来自类似的输入

狗1开始狗2a狗2b结束狗3开始狗4a狗4b结束狗5

你没有得到预期的输出

dog1开始cat2acat2b结束dog3开始cat4acat4b结束dog5

package test;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class TestMatcher {

    public static void main(String[] args) throws Exception {
        String inputText = "dog1 start dog2a dog2b end dog3 start dog4a dog4b end dog5";
        System.out.println("input  = " + inputText);
        StringBuffer result = new StringBuffer();
        Pattern pattern = Pattern.compile("dog");
        Matcher matcher = pattern.matcher(inputText);

        int startPos = inputText.indexOf("start");
        int endPos = inputText.indexOf("end");
        System.out.println("Setting region to " + startPos + "," + endPos);
        matcher.region(startPos, endPos);
        while (matcher.find()) {
            matcher.appendReplacement(result, "cat");
        }
        System.out.println("Partial result = " + result);

        startPos = inputText.indexOf("start", endPos);
        endPos = inputText.indexOf("end", startPos);
        System.out.println("Setting region to " + startPos + "," + endPos);
        matcher.region(startPos, endPos);
        while (matcher.find()) {
            matcher.appendReplacement(result, "cat");
        }
        matcher.appendTail(result);
        System.out.println("Final result   = " + result);
    }
}

Output:

input  = dog1 start dog2a dog2b end dog3 start dog4a dog4b end dog5
Setting region to 5,23
Partial result = dog1 start cat2a cat
Setting region to 32,50
Final result   = dog1 start cat2a catdog1 start dog2a dog2b end dog3 start cat4a cat4b end dog5

子区域不是必须由单独的匹配器处理吗？喜欢：

public static void main(String[] args) {
  String inputText = "dog1 start dog2a dog2b end dog3 start dog4a dog4b end dog5";

  System.out.println("Input          = " + inputText);
  StringBuffer result = new StringBuffer();
  Pattern pattern = Pattern.compile("(start(.*?)end)");

  Matcher matcher = pattern.matcher(inputText);

  while (matcher.find()) {
    int s = matcher.start();
    int e = matcher.end();
    System.out.printf("(%d .. %d) -> \"%s\"\n", s, e, matcher.group(1));
    matcher.appendReplacement(result, processSubGroup(matcher.group(1), matcher.group(2)));
  }
  matcher.appendTail(result);
  System.out.println("Final result   = " + result);
}

static String processSubGroup(String subGroup, String contents) {
  StringBuffer result = new StringBuffer();
  Pattern pattern = Pattern.compile("dog");

  Matcher matcher = pattern.matcher(subGroup);

  while (matcher.find())
    matcher.appendReplacement(result, "cat");

  matcher.appendTail(result);
  return result.toString();
}

或者，没有日志相关的东西并且更简单：

public static void main(String[] args) {
  String inputText = "dog1 start dog2a dog2b end dog3 start dog4a dog4b end dog5";

  StringBuffer result = new StringBuffer();
  Pattern pattern = Pattern.compile("(start(.*?)end)");

  Matcher matcher = pattern.matcher(inputText);

  while (matcher.find())
    matcher.appendReplacement(result, processSubGroup(matcher.group(1), matcher.group(2)));

  matcher.appendTail(result);
  System.out.println("Final result   = " + result);
}

static String processSubGroup(String subGroup, String contents) {
  return Pattern.compile("dog").matcher(subGroup).replaceAll("cat");
}

Result:

Input          = dog1 start dog2a dog2b end dog3 start dog4a dog4b end dog5
(5 .. 26) -> "start dog2a dog2b end"
(32 .. 53) -> "start dog4a dog4b end"
Final result   = dog1 start cat2a cat2b end dog3 start cat4a cat4b end dog5

或者更抽象的方法：

interface GroupProcessor {
  String process(String group);
}

public static void main(String[] args) {
  String inputText = "dog1 dogs dog2a dog2b enddogs cow1 dog3 cows cow2a cow2b endcows dog4 dogs dog5a dog5b enddogs cow3";

  String result = inputText;

  result = processGroup(result, "dogs*enddogs", (group) -> {
    return Pattern.compile("dog").matcher(group).replaceAll("cat");
  });

  result = processGroup(result, "cows*endcows", (group) -> {
    return Pattern.compile("cow").matcher(group).replaceAll("sheep");
  });

  System.out.println("Input        = " + inputText);
  System.out.println("Final result = " + result);
}

static String processGroup(String input, String regex, GroupProcessor processor) {
  StringBuffer result = new StringBuffer();
  Pattern pattern = Pattern.compile(String.format("(%s)", regex.replace("*", "(.*?)")));

  Matcher matcher = pattern.matcher(input);

  while (matcher.find())
    matcher.appendReplacement(result, processor.process(matcher.group(1)));

  matcher.appendTail(result);
  return result.toString();
}

这将为我们提供：

Input        = dog1 dogs dog2a dog2b enddogs cow1 dog3 cows cow2a cow2b endcows dog4 dogs dog5a dog5b enddogs cow3
Final result = dog1 cats cat2a cat2b endcats cow1 dog3 sheeps sheep2a sheep2b endsheeps dog4 cats cat5a cat5b endcats cow3

Upd.

原因，为什么Matcher.region()重置隐式匹配器状态，因此，lastAppendPosition.

appendReplacement and appendTail在某种程度上是一种只向前移动的机制，而.region()并不是那么确定。

假设以下情况：对于 100 个字符的字符串，您应用了区域 0..20，执行find()-appendReplacement()循环，然后将区域移动到例如 30..60，并再次执行替换循环。

现在你有 0..100 源字符串和 0..60 替换结果字符串StringBuffer.

接下来，将区域 10..40 应用到源字符串...接下来做什么？如果源字符串的该区域不包含匹配项 - 好的，什么都不做，但如果它does包含匹配项？应该在哪里appendReplacement追加/插入替换结果？结果字符串已经超过了 10..40 区域并且appendReplacement only appends, not replaces输出缓冲区中字符串的分区。

如果存在某种约束机制，则该区域设置仅限于类似MAX(start, lastAppendPosition)..MIN(end, sourceLength)，那么好吧，附加机制可以正常工作，但是.region()方法没有这样的限制，或者它们（限制）会使.region()方法对于搜索来说毫无用处（其中is主要目的.region()方法）。

这就是为什么.region()重置匹配器的隐式状态，使其与appendReplacement()相关的东西。如果您需要不同的行为 - 扩展Matcher通过封装的类。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

对多个区域使用 Matcher.appendReplacement() 的相关文章

具有默认值的 Java JAX-RS 自定义参数

假设我有这个这只是一个示例 GET Path value address Produces application json public Response getAddress QueryParam user User user 用户是
Java - 如何将特殊字符放入字符串中

Java 似乎有很好的字符串处理能力尽管如此我还是遇到了最简单的问题我需要动态字符串它们在运行时更改因此字符串类型不是一个好的选择因为它们是不可变的所以我使用字符数组设置起来有点痛苦但至少它们是可以修改的我想创建一个字符
Hashmap并发问题

我有一个哈希图出于速度原因我希望不需要锁定假设我不介意过时的数据同时更新它和访问它会导致任何问题吗我的访问是获取而不是迭代删除是更新的一部分是的这会导致重大问题一个例子是向散列映射添加值时可能发生的情况这可能会导致表重
将 Hibernate 对象序列化为 JSON 时抛出异常

好吧我正在使用 Hibernate 将一个小型数据库加载到一些表示表的类并与数据库交互一切都很好我真的可以看到所有结果而且我没有任何空字段所有这些都已被使用这里我展示了主类表 import javax persistenc
MongoTemplate upsert - 从 pojo 进行更新的简单方法（哪个用户已编辑）？

这是一个简单的 pojo public class Description private String code private String name private String norwegian private String en
防止 Spring Boot 注册 Spring Security 过滤器之一

我想禁用安全链中的 Spring Security 过滤器之一我已经看到了防止 Spring Boot 注册 servlet 过滤器 https stackoverflow com questions 28421966 prevent s
使用 Java 在 WebDriver 中按 Ctrl+F5 刷新浏览器

我已经使用 java 刷新了 WebDriver 中的浏览器代码如下 driver navigate refresh 如何使用 Java 在 WebDriver 中按 Ctrl F5 来做到这一点我认为您可以使用 WebDriver 和
解决 Java Checkstyle 错误：名称 'logger' 必须匹配模式 '^[A-Z][A-Z0-9]*(_[A-Z0-9]+)*$'

使用 Eclipse Checkstyle 插件我看到以下错误名称 logger 必须匹配模式 A Z A Z0 9 A Z0 9 我通过更改解决了此错误 private static final Logger logger Logger
Spring3/Hibernate3/TestNG：有些测试给出 LazyInitializationException，有些则没有

前言我在单元测试中遇到了 LazyInitializationException 的问题而且我很难理解它正如你从我的问题中看到的那样Spring 中的数据库会话 https stackoverflow com questions 13
如何拦截 REST 端点以接收所有标头？

我当前的代码是 Path login RequestScoped public class LoginResource GET SecurityChecked public Response getUser HeaderParam AUTH
Java Microsoft Excel API [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
JFace ColumnWeigthData 导致父级增长

我有一个 Eclipse RCP 应用程序并且想要在TableViewer using ColumnWeigthData as ColumnLayoutData 问题是父表单 ScrolledForm在示例代码中每当我布局表格时都会增加
Java-如何将黑白图像加载到二进制中？

我在 FSE 模式下使用 Java 和 swing 我想将完全黑白图像加载为二进制格式最好是二维数组并将其用于基于掩码的每像素碰撞检测我什至不知道从哪里开始过去一个小时我一直在研究但没有找到任何相关的东西只需将其读入Buffer
从 @JsonProperty 值获取枚举常量

我有一个标有 JsonProperty 的枚举用于使用 Jackson 进行 JSON 序列化反序列化并且希望获取给定字符串 JsonProperty 的枚举值 public enum TimeBucket JsonProperty
在 IntelliJ 中运行 Spring Boot 会导致 Unable to load 'javax.el.ExpressionFactory'

我正在尝试运行一个简单的 Spring Boot 应用程序该应用程序具有以下 Maven pom file
Java：java.util.ConcurrentModificationException

我正在制作 2D 目前正在研究用子弹射击子弹是一个单独的类所有项目符号都存储在称为项目符号的数组列表中当它超出屏幕一侧 Exception in thread main java util ConcurrentModification
Android Gradle 同步失败：无法解析配置“：classpath”的所有工件

错误如下 Caused by org gradle api internal artifacts ivyservice DefaultLenientConfiguration ArtifactResolveException Could n
使用 secp256r1 曲线和 SHA256 算法生成 ECDSA 签名 - BouncyCastle

我正在尝试使用带有 secp256r1 曲线 P256 的 ECDSA 和用于消息哈希的 SHA256 算法生成签名我也在使用 Bouncy Castle 库下面的代码 public class MyTest param args pu
为什么这个私人浮动字段变为零？

我有一些奇怪的行为我很难向自己解释称为 textureScale 的浮点字段变为零如果某些代码正在更改该值则可以解释这一点然而我希望能够通过将其设置为私有最终浮点来导致构建失败或者至少是运行时异常那么无论更改该值都将失败
防止Java实例化的正确方法[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi

随机推荐

基于 R 中字符串比较的相似度分数（编辑距离）

我正在尝试根据两个字符串之间的比较来分配相似度分数 R 中是否有相同的函数我知道 SAS 中有一个名为 SPEDIS 的函数如果R中有这样的函数请告诉我功能adist http stat ethz ch R manual R pat
将 Data.Constraint.Forall 与等式约束一起使用

假设我有一个这样的函数 LANGUAGE ScopedTypeVariables class C a where foo forall f a b C f a C f b gt f a gt f b foo 现在如果我想移动范围a and
用于 Web 服务的 SOAP 还是 REST？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 REST 是一种更好的 Web 服务方法还是 SOAP 或者它们是针对不同问题的不同工具吗或者这是一个微妙的问题也就是说一个在某些领域比另
Appfabric WF4-WCF服务，如何在没有httpcontext的情况下检索codeactivity中的当前url？

我开发了一个带有代码活动的 wf wcf 服务我想在其中检索该服务的当前 URL 如果我禁用 appfabric 的持久性功能我可以使用以下命令检索 URL HttpContext Current Request Url ToStrin
Swift - 协议作为按钮操作的目标类型

我正在尝试创建 HeaderView 它是 UIView 的子类它包含一个关闭按钮和一个标题标签 class HeaderView UIView private var titleLabel UILabel private var clo
无法将 _InternalLinkedHashMap 转换为任何内容

尽管我首先将其作为地图上传但从 Firebase RealtimeDatabase 获取数据作为地图时遇到了一些问题我看到的所有解决方案都是您应该将 snapshot value 转换为传入的数据类型但对我来说没有任何迭代我已经可以
如何将 MongoDB 与 Solr 集成？

我以前见过这个问题但从未收到真正的答案所以我想知道有人可以指出我如何将 mongoDB 与 Solr 集成的正确方向吗我正在寻找伪实时和最终的一致性做过这件事的人可以透露一些信息吗如果有帮助的话我还将 PHP Zend 与 D
如何使用 Rails 2.1 和 MySQL 定义 BigInt 主键？

从 Rails 2 1 开始如果您在迁移中定义一个新列其类型设置为 integer 且 limit 设置为 5 或更多则在 MySQL 数据库中实际创建的列将是 BigInt 类型那很完美但我不知道如何创建具有 BigInt 主键
高级错误处理

我最近摆了个姿势这个问题 https stackoverflow com questions 15295004 disregarding simple warnings errors in trycatch noredirect 1 com
使用 Java 为 Blogger API 验证自己的 Google 帐户

我想编写一个将本地文件发布到 Google Blogger 的机器人我将是唯一使用此应用程序的人因此我不需要设置用户友好的身份验证例程我花了一个晚上尝试进行设置但仍然在处理 OAuth 请求方面遇到困难我创建了一个新的 Googl
现代 OpenGL 相当于 glBegin/glEnd 的是什么

我正在为 OpenGL 构建一个图形 API 它基于基本的调用绘制图形样式基本上不是将数据存储到 GPU 中并使用它的句柄调用它而是提供信息来绘制每次更新应该绘制的内容我知道它很慢但它很简单而且适用于非性能关键型应用程序无论
正则表达式：如何匹配不仅仅是数字的字符串

是否可以编写一个正则表达式来匹配所有不匹配的字符串only包含数字如果我们有这些字符串 abc a4c 4bc ab4 123 它应该匹配第一个但不是最后一个我尝试在 RegexBuddy 中摆弄前瞻之类的东西但我似乎无法弄清楚 d
如何在关系数据库中建模多语言实体

如果我们要开发一个多语言应用程序我们应该将翻译存储在资源文件 or the database 假设我们选择在数据库中进行是否有一种标准方法来建模多语言实体关系模型 1 一张大翻译表我们可以将所有翻译存储在一张表中并使用语言中立键为属性
Flexbox行：不根据内容增长？ [复制]

这个问题在这里已经有答案了我有以下结构我想了解为什么我的行不随其内部内容增长 row border solid red display flex flex direction row cell border solid green fl
在 Maps API 浏览器上设置 HTTP Referrer 会导致 403 错误

我对 HTTP Referrer 设置如何在 Google Maps API 浏览器密钥上工作感到困惑我正在构建一个网页以编程方式从 Google 地图请求图像主要是 Google 地图街景图像 API 但也从 Javascript
spring-boot-starter-web 和 spring-boot-starter-webflux 不能一起工作吗？

当我开始学习spring webflux 我对这个组件有疑问我建立了一个简单的项目使用maven来管理它我添加了相关的依赖项spring boot starter web and spring boot starter webflux
Rufus 调度程序未登录生产环境

我的 Rails 应用程序在初始化程序中使用 rufus scheduler 启动一个进程这是初始化程序代码的精简版本 config logger isn t available here so we have to grab it fr
React 将 JQuery 代码应用于组件内的元素

我有一个正在使用 React 的应用程序我现在遇到一个问题我正在尝试实施bootstrap 所见即所得 bootstrap3 所见即所得 https github com bootstrap wysiwyg bootstrap3 wys
自动删除SQS队列

有没有办法完全自动删除 SQS 队列我有一个解决方案其中服务器在启动时创建 SQS 并订阅 SNS 主题然而可能存在服务器崩溃且无法恢复的情况在这种情况下我会用另一台服务器替换该服务器该服务器会在启动时创建自己的队列现在之前
对多个区域使用 Matcher.appendReplacement()

java Matcher appendReplacement 方法带有appendTail 应该让我将源文本转换为结果文本同时替换所有出现的模式伪语言的算法类似于 while Matcher find call Matcher app

对多个区域使用 Matcher.appendReplacement()

对多个区域使用 Matcher.appendReplacement() 的相关文章

随机推荐

热门标签