如何删除不平衡/不成对的双引号（在 Java 中）

2024-01-14

我想把这个相对聪明的问题分享给这里的大家。我正在尝试从字符串中删除不平衡/不配对的双引号。

我的工作正在进行中，我可能即将找到解决方案。但是，我还没有找到可行的解决方案。我无法从字符串中删除未配对/未配对的双引号。

输入示例

string1=injunct! alter ego."
string2=successor "alter ego" single employer"  "proceeding "citation assets"

输出应该是

string1=injunct! alter ego.
string2=successor "alter ego" single employer  proceeding "citation assets"

这个问题听起来类似于使用 Java 删除不平衡/不配对的括号 https://stackoverflow.com/questions/9898455/using-java-remove-unbalanced-unpartnered-paranthesis

这是到目前为止我的代码（它不会删除所有不成对的双引号）

private String removeUnattachedDoubleQuotes(String stringWithDoubleQuotes) {
    String firstPass = "";

    String openingQuotePattern = "\\\"[a-z0-9\\p{Punct}]";
    String closingQuotePattern = "[a-z0-9\\p{Punct}]\\\"";

    int doubleQuoteLevel = 0;
    for (int i = 0; i < stringWithDoubleQuotes.length() - 3; i++) {
        String c = stringWithDoubleQuotes.substring(i, i + 2);
        if (c.matches(openingQuotePattern)) {
            doubleQuoteLevel++;
            firstPass += c;
        }
        else if (c.matches(closingQuotePattern)) {
            if (doubleQuoteLevel > 0) {
                doubleQuoteLevel--;
                firstPass += c;
            }
        }
        else {
            firstPass += c;
        }
    }

    String secondPass = "";
    doubleQuoteLevel = 0;
    for (int i = firstPass.length() - 1; i >= 0; i--) {
        String c = stringWithDoubleQuotes.substring(i, i + 2);
        if (c.matches(closingQuotePattern)) {
            doubleQuoteLevel++;
            secondPass = c + secondPass;
        }
        else if (c.matches(openingQuotePattern)) {
            if (doubleQuoteLevel > 0) {
                doubleQuoteLevel--;
                secondPass = c + secondPass;
            }
        }
        else {
            secondPass = c + secondPass;
        }
    }

    String result = secondPass;

    return result;
}

如果没有嵌套，它可能可以在单个正则表达式中完成。
有一个粗略定义的分隔符的概念，并且可以“偏差”
这些规则是为了获得更好的结果。
这完全取决于制定什么规则。这个正则表达式考虑到
按顺序排列三种可能的情况；

有效对
无效对（有偏差）
无效单

它也不会解析超出行尾的“”。但它确实有多种作用
行组合为单个字符串。要改变这一点，请删除\n你在哪里看到它。

全局上下文 - 原始查找正则表达式
缩短了

(?:("[a-zA-Z0-9\p{Punct}][^"\n]*(?<=[a-zA-Z0-9\p{Punct}])")|(?<![a-zA-Z0-9\p{Punct}])"([^"\n]*)"(?![a-zA-Z0-9\p{Punct}])|")

替换分组

$1$2 or \1\2

扩展的原始正则表达式：

(?:                            // Grouping
                                  // Try to line up a valid pair
   (                                 // Capt grp (1) start 
     "                               // "
      [a-zA-Z0-9\p{Punct}]              // 1 of [a-zA-Z0-9\p{Punct}]
      [^"\n]*                           // 0 or more non- [^"\n] characters
      (?<=[a-zA-Z0-9\p{Punct}])         // 1 of [a-zA-Z0-9\p{Punct}] behind us
     "                               // "
   )                                 // End capt grp (1)

  |                               // OR, try to line up an invalid pair
       (?<![a-zA-Z0-9\p{Punct}])     // Bias, not 1 of [a-zA-Z0-9\p{Punct}] behind us
     "                               // "
   (  [^"\n]*  )                        // Capt grp (2) - 0 or more non- [^"\n] characters
     "                               // "
       (?![a-zA-Z0-9\p{Punct}])      // Bias, not 1 of [a-zA-Z0-9\p{Punct}] ahead of us

  |                               // OR, this single " is considered invalid
     "                               // "
)                               // End Grouping

Perl 测试用例（没有 Java）

$str = '
string1=injunct! alter ego."
string2=successor "alter ego" single employer "a" free" proceeding "citation assets"
';

print "\n'$str'\n";

$str =~ s
/
  (?:
     (
       "[a-zA-Z0-9\p{Punct}]
        [^"\n]*
        (?<=[a-zA-Z0-9\p{Punct}])
       "
     )
   |
       (?<![a-zA-Z0-9\p{Punct}])
       " 
     (  [^"\n]*  )
       " (?![a-zA-Z0-9\p{Punct}])
   |
       "
  )
/$1$2/xg;

print "\n'$str'\n";

Output

'
string1=injunct! alter ego."
string2=successor "alter ego" single employer "a" free" proceeding "citation assets"
'

'
string1=injunct! alter ego.
string2=successor "alter ego" single employer "a" free proceeding "citation assets"
'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

regex

stringparsing

如何删除不平衡/不成对的双引号（在 Java 中）的相关文章

如何在一行中将字符串数组转换为双精度数组

我有一个字符串数组 String guaranteedOutput Arrays copyOf values values length String class 所有字符串值都是数字数据应转换为Double QuestionJava 中
我需要在 Spring 中检查每个控制器中的有效会话吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案假设在 Spring Mvc 的 Web 应用程序中我们是否需要检查每个控制器或 jsps 中的有效会话我该如何解决 MVC 中的
IntelliJ IDEA 创建的 JAR 文件无法运行

我在 IntelliJ 中编写了一个跨越几个类的程序当我在 IDE 中测试它时它运行良好但是每当我按照教程将项目制作成 jar 可执行文件时它就不会运行双击 out 文件夹中的文件时该文件不会运行并显示无法启动 Java J
使用 ANTLR 为 java 源代码生成抽象语法树

如何使用 ANTLR 从 java src 代码生成 AST 有什么帮助吗好的步骤如下前往ANTLR站点 http www antlr org 并下载最新版本下载Java g和JavaTreeParser g文件来自here htt
Java 页面爬行和解析之 Crawler4j 与 Jsoup

我想获取页面的内容并提取其中的特定部分据我所知此类任务至少有两种解决方案爬虫4j https github com yasserg crawler4j and Jsoup http jsoup org 它们都能够检索页面的内容并提取其
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
Clip 在 Java 中播放 WAV 文件时出现严重延迟

我编写了一段代码来读取 WAV 文件大小约为 80 mb 并播放该文件问题是声音播放效果很差极度滞后你能告诉我有什么问题吗这是我的代码我称之为doPlayJframe 构造函数内的函数 private void doPlay f
在具有相同属性名称的不同数据类型上使用 ModelMapper

我有两节课说Animal AnimalDto我想用ModelMapper将 Entity 转换为 DTO 反之亦然但是对于具有相似名称的一些属性这些类应该具有不同的数据类型我该如何实现这一目标动物 java public class
Java中接口作为方法参数

前几天去面试被问到了这样的问题问反转链表给出以下代码 public class ReverseList interface NodeList int getItem NodeList nextNode void reverse No
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
将 Long 转换为 DateTime 从 C# 日期到 Java 日期

我一直尝试用Java读取二进制文件而二进制文件是用C 编写的其中一些数据包含日期时间数据当 DateTime 数据写入文件以二进制形式时它使用DateTime ToBinary on C 为了读取 DateTime 数据它将首
当单元格内的 JComboBox 中有 ItemEvent 时，如何获取 CellRow

我有一个 JTable 其中有一列包含 JComboBox 我有一个附加到 JComboBox 的 ItemListener 它会根据任何更改进行操作但是 ItemListener 没有获取更改的 ComboBox 所在行的方法当组合框
Springs 元素“beans”不能具有字符 [children]，因为该类型的内容类型是仅元素

我在 stackoverflow 中搜索了一些页面来解决这个问题确实遵循了一些正确的答案但不起作用我是春天的新人对不起这是我的调度程序 servlet
将 JTextArea 内容写入文件

我在 Java Swing 中有一个 JTextArea 和一个提交按钮需要将textarea的内容写入一个带有换行符的文件中我得到的输出是这样的它被写为文件中的一个字符串 try BufferedWriter fileOut n
android Accessibility-service 突然停止触发事件

我有一个 AccessibilityService 工作正常但由于开发过程中的某些原因它停止工作我似乎找不到这个原因请看一下我的代码并告诉我为什么它不起作用 public class MyServicee extends Access
休眠以持久保存日期

有没有办法告诉 Hibernate java util Date 应该持久保存我需要这个来解决 MySQL 中缺少的毫秒分辨率问题您能想到这种方法有什么缺点吗您可以自己创建字段long 或者使用自定义的UserType 实施后User
如何为 Imagus 悬停缩放扩展开发自定义过滤器？

当我读到关于悬停缩放是邪恶的 http www reddit com r YouShouldKnow comments 1wjrc8 ysk that the hover zoom extension is spyware 哎呀有两篇文章
java迭代器内部是如何工作的？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有一个员工列表 List
java8 Collectors.toMap() 限制？

我正在尝试使用java8Collectors toMap on a Stream of ZipEntry 这可能不是最好的想法因为在处理过程中可能会发生异常但我想这应该是可能的我现在收到一个我不明白的编译错误我猜是类型推理引擎这是
Jackson 将单个项目反序列化到列表中

我正在尝试使用一项服务该服务为我提供了一个带有数组字段的实体 id 23233 items name item 1 name item 2 但是当数组包含单个项目时将返回该项目本身而不是包含一个元素的数组 id 43567 item

随机推荐

从同一页面上的 php 函数调用表单提交操作

我正在开发一个简单的网络应用程序为了减少文件数量我想将表单提交功能的 php 代码放入与表单相同的页面中像这样的东西
该函数的运算符参数太多？

制作了我自己的字符串类显然是为了家庭作业并且我的两个运算符出现了奇怪的语法错误我的相等和添加运算符声称我有太多参数即在我的 h 文件中但随后又声称该方法甚至不属于我的 cpp 文件中的类我什至将相等运算符设为朋友但智能感知仍然
在字符串中查找文本并添加到其他位置

我正在尝试查找一些文本正则表达式 w http bit ly w ig它将找到这条绳子并将其拉出将其移动到 span 标签或在末尾 p tag p p class regex Text before http bit ly wtGAhs
Access ODBC 出现“未找到数据源名称且未指定默认驱动程序”

我的软件 Python 3 4 64 位 PyODBC 64 位已安装 MS Office 软件包 32 位 Problem 现在我尝试使用 PYODBC 访问计算机中安装的 MS Access 2010 无论我尝试什么它都不起作用
文本文件中任意行的反转（rev 命令的实现）

我尝试编写一段代码来旋转文本文件中的每一行例如给出下一行 a b c 输出将是 c b a 该脚本仅获取一个参数作为参数文本文件的名称另外我想这样做这样对额外的空间也很有意义即给出下一行 a b c 输出将是 c b a 注
C#、NUnit 在循环中断言

我有一项学校作业需要创建数据驱动风格的 NUnit 测试使用下面的代码我可以从数据库获取数据但是每次 Assert 调用失败时测试就会停止有什么方法可以实际将循环结果显示为六个不同的测试考虑到我的数据库中有六行 namespa
readelf -S 输出中的 ES、Lk、Inf 和 Al 列标题的含义是什么？

在输出中readelf S 我想知道列标题是什么ES Lk Inf and Al mean 例如 Section Headers Nr Name Type Addr Off Size ES Flg Lk Inf Al 0 NULL 0000
在 ASP .NET MVC 中编辑和更新实体框架实体

我有一个名为 ABC 的实体框架实体属性 ID 和标题在更新记录视图中我已将 ID 添加为隐藏字段标题为文本框控制器看起来像这样 public ActionResult UpdateAction ABC obj 我在 obj 中得
如何将新列添加到 CSV 文件行的开头？

我有一个 csv 文件其中有 6 到 8 列 Ex ID Test Description file name module view path1 path2 我想添加新列 Node 到开头 Ex Node ID Test Descrip
下面的 SQL HashBytes 函数需要 C# 等效项

我在 sql 中使用以下函数创建了哈希值 SQL查询 Select hashbytes MD5 PNumber CONVERT VARCHAR 50 cast datestamp as binary 1 From dbo Events 现在
如何更改jboss-7中的端口号

我使用的是jboss 7 我想将端口号从8080更改为7001 我需要更改哪个文件该文件是 JBOSS HOME standalone configuration standalone xml Find
可以创建 Websphere 队列管理器但无法连接

我需要编写一个连接到 WebSphere MQ 队列的 Net 连接器因此我在 Windows 7 计算机上安装了 IBM WebSphere MQ 的试用版我最初在 MQ Explorer 中设置了一些虚拟队列来进行设置过程并且我能
为什么每个应用程序有一个 JVM？

我读到每个应用程序都在自己的 JVM 中运行为什么会这样呢他们为什么不让一个 JVM 运行 2 个或更多应用程序我读了一篇 SO 帖子但无法在那里得到答案每个 Java 应用程序是否有一个 JVM https stackoverf
Apache poi 项目符号和编号

我正在使用 apache POI 将 Word 文档转换为 pdf 我正在用动态数据填充表行一切工作正常但我想做一些增强即我想在每行数据之前添加一个项目符号这是我用来填充表中的行数据的 for 循环 for String strin
Ionic v3：按日期/天对列表进行分组

在 Ionic 的旧版本 1 中我能够构建一个按日期分组的事件列表如下所示
访问 Dockerfile 中的上下文外部

在我的 Maven 项目中我有以下结构 docker docker compose yml A Dockerfile B Dockerfile src target foo war 在 A 的 Dockerfile 中我需要访问 war
如何通过编程方式更改Toast的对齐方式？ [复制]

这个问题在这里已经有答案了可能的重复如何改变Android中Toast的位置 https stackoverflow com questions 2506876 how to change position of toast in an
Sass 中的多个二类选择器

对于单个声明块有多个两类选择器是否可以简化以下内容即不必重复body tag body shop body contact body about body faq background color fff 尝试这个 body shop
Delphi 警告 - W1002 符号“FileSetDate”特定于平台

当我在 Delphi 2006 下编译我的应用程序时我收到以下警告 Pascal 警告 W1002 符号 FileSetDate 特定于平台我必须做什么才能抑制这个警告代码 MyLastError FileSetDate Files
如何删除不平衡/不成对的双引号（在 Java 中）

我想把这个相对聪明的问题分享给这里的大家我正在尝试从字符串中删除不平衡不配对的双引号我的工作正在进行中我可能即将找到解决方案但是我还没有找到可行的解决方案我无法从字符串中删除未配对未配对的双引号输入示例 string1 i

如何删除不平衡/不成对的双引号（在 Java 中）

如何删除不平衡/不成对的双引号（在 Java 中） 的相关文章

随机推荐

热门标签

如何删除不平衡/不成对的双引号（在 Java 中）的相关文章