按 HTML 实体分割字符串?

2024-04-22

我的字符串包含很多 HTML 实体,就像这样

"大家好  大家好"

我想按 HTML 实体将其拆分为:

Hello
大家
there

有人可以建议我一种方法吗?可能正在使用正则表达式?


看起来你可以分开&[^;]*;正则表达式。也就是说,分隔符是以以下开头的字符串&, 以。。结束;,并且在两者之间可以有任何东西,但;.

如果连续可以有多个分隔符,并且不希望它们之间有空字符串,则只需使用(&[^;]*;)+(或者一般来说(delim)+图案)。

如果您可以在字符串的开头或前面有分隔符,并且您不希望它们成为由它们引起的空字符串,那么只需在拆分之前将它们修剪掉即可。


Example

这是演示上述想法的片段(另请参阅 ideone.com http://ideone.com/IOYVV):

var s = ""Hello <everybody> there""

print (s.split(/&[^;]*;/));
// ,Hello,,everybody,,there,

print (s.split(/(?:&[^;]*;)+/));
// ,Hello,everybody,there,

print (
   s.replace(/^(?:&[^;]*;)+/, "")
    .replace(/(?:&[^;]*;)+$/, "")
    .split(/(?:&[^;]*;)+/)
);
// Hello,everybody,there
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

按 HTML 实体分割字符串? 的相关文章

随机推荐

  • reg 声明中的位顺序

    如果我需要使用 4 个 8 位数字 我会声明以下 reg reg 7 0 numbers 3 0 我对第一个和第二个声明 7 0 和 3 0 之间的区别感到很困惑 他们应该按什么顺序来 第一个是保留数字的大小 而第二个是保留数字的数量 还是
  • 为什么修改数组的副本会影响原始数组?

    大家好 如果这是一个菜鸟问题 我很抱歉 但我使用的是 python 我有一个问题 我复制一个数组 但当我修改副本时 它会影响原始数组 我想将边界矩阵的线性偏移添加到一组坐标 boundaries 5 818 0 0 0 0 0 0 5 81
  • TFS + 获取最新版本

    当我从 TFS 获取最新版本时 有没有办法列出已更新的文件 如果您使用的是 Visual Studio IDE 您可以在 输出 窗口中看到文件列表 要查看 输出 窗口 请选择菜单 视图 gt 输出 希望这可以帮助
  • Dialyzer 无法识别使用多态类型的函数中的错误

    背景 我正在尝试使用透析器进行多态打字 作为一个例子 我正在使用著名的Option类型 又名 Maybe Monad 现在在许多其他语言中都很流行 defmodule Test do type option t some t nothing
  • Kotlin 中参数的通用通配符

    我有一个用于监听 api 回调的抽象类 如下所示 ApiRs 是每个 API 响应对象都继承自它的父对象 abstract class ApiCallback
  • swift 中的 UIView viewwithtag 方法[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我正在努力学习一些快速的知识 我以编程方式添加标签 我想稍后更改它们的属性 viewwithtag 方法返回一个 UIView 如何从
  • 复制切片的通用方法

    我需要复制切片 以及底层数组的一部分 以便调用者不会改变数组的原始元素 我想我可以编写一个函数来对特定类型的数组执行此操作 func duplicateSliceOfSomeType sliceOfSomeType SomeType Som
  • 由于将请求从主线程传递到工作线程,netty 中出现延迟?

    我有一些关于 Netty 服务器端 TCP IP 应用程序的问题 我想知道在将请求从老板线程传递到工作线程时是否会因为 netty 由于缺少配置等 而出现延迟 我在用 new OrderedMemoryAwareThreadPoolExec
  • 使用 SolidJS 中的 fetch API 渲染远程数据

    我是一个使用 Solid JS 以及就此而言的 JS 的新手 并且在尝试填充 自定义 时遇到了看似奇怪的行为 table 使用来自 API 的数据的组件fetch 这是我的 table import Component For from s
  • 为什么我的 SqlConnection 在关闭后仍保留在 SSMS 进程列表中?

    我有一个 C 控制台应用程序 代码如下 using var cn new SqlConnection cn ConnectionString Data Source localhost Integrated Security True Pe
  • 使用 Xcode 的命令行构建工具进行存档(xcodebuild archive)

    用于构建 Xcode 项目的命令行工具 xcodebuild 在 Xcode 4 中提供了一个新的构建操作 archive From man xcodebuild archive Archive a scheme from the buil
  • SwiftUI Focus State API 环境变量不起作用

    当我们想要观察 SwiftUI 文本字段的焦点状态时 环境值 isFocused 似乎不起作用 除了将值传递给 TextFieldStyle 的 init 我们必须为每个 Textfield 执行此操作 之外 还有其他方法可以做到这一点吗
  • 如何重置html中选定的索引下拉值?

    我需要在提交表单后为下拉菜单设置 selectedindex 0 我尝试如下 filterByName prop selectedIndex 0 filterByName selectedIndex 0 filterByName get 0
  • Oracle 查询和聚合函数

    我假设在oracle 中有表名employee 1 如果 mobile no 和 sim no 相同 我想选择最大 start date 我已经尝试过 但没有成功 请帮忙 下面是employee 1表 Mobile No Sim NO St
  • 将字符串数组绑定到 datagridview 的列

    我正在设计一个有 datagridview 的 winform 我正在为该 datagridview 分配一个数据表 DataTable dt new DataTable dt Columns Add items typeof string
  • 学习 MacRuby 的好资源 [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我不懂 Ruby 但我有兴趣学习 MacRuby 您会推荐什么作为您的最佳资源 书籍 博客 网站 Fo
  • 实体框架迁移问题

    我在 EF 迁移方面遇到问题 特别是让 Enable Migrations 命令发挥作用 当我在包管理器控制台中执行命令时 收到以下错误 System Management Automation PSArgumentException 找不
  • ASP.NET Core 2.0 站点 - FileIOException System.Runtime

    一位同事正在为我们的下一份工作整理一些框架项目 这些项目在他的机器上运行良好 并且我们的其中一台开发服务器正在托管开发实例 由于我们刚刚建立 这些项目或多或少是空的 由单个静态 html 文件组成 这些项目在我的开发机器上构建得很好 但一旦
  • Python 3.x 列表理解 VS 元组生成器

    我想使用内存 速度或其他什么原因吗 tuple i for i in range 5000 代替 i for i in range 5000 如果我不介意元组的不变性 基本上 列表理解比生成器表达式更快 因为 它的迭代在 C 中执行 请阅读
  • 按 HTML 实体分割字符串?

    我的字符串包含很多 HTML 实体 就像这样 大家好 大家好 我想按 HTML 实体将其拆分为 Hello大家 there 有人可以建议我一种方法吗 可能正在使用正则表达式 看起来你可以分开 正则表达式 也就是说 分隔符是以以下开头的字符串