如何在Java中更改HTML标签内容？

2024-01-03

如何更改Java中标签的HTML内容？例如：

before:

<html>
    <head>
    </head>
    <body>
        <div>text<div>**text**</div>text</div>
    </body>
</html>

after:

<html>
    <head>
    </head>
    <body>
        <div>text<div>**new text**</div>text</div>
    </body>
</html>

我尝试过 JTidy，但不支持getTextContent。还有其他解决办法吗？

谢谢，我想解析没有格式良好的 HTML。我尝试了 TagSoup，但是当我有以下代码时：

<body>
sometext <div>text</div>
</body>

我想将“sometext”更改为“someAnotherText”，当我使用{bodyNode}.getTextContent()它给了我：“sometext text”；当我使用setTextContet("someAnotherText"+{bodyNode}.getTextContent())，并将这些结构序列化，结果是<body>someAnotherText sometext text</body>，没有<div>标签。这对我来说是个问题。

除非您完全确定 HTML 有效且格式良好，否则我强烈建议使用 HTML 解析器，例如TagSoup http://www.ccil.org/~cowan/XML/tagsoup/, Jericho http://jericho.htmlparser.net/docs/index.html, NekoHTML http://www.apache.org/~andyc/neko/doc/html/, HTML解析器 http://htmlparser.sourceforge.net/等等，前两个对于解析任何类型的垃圾特别强大:)

例如，与HTML解析器 http://htmlparser.sourceforge.net/（因为实现很容易），使用visitor http://htmlparser.sourceforge.net/javadoc/org/htmlparser/visitors/package-summary.html，提供您自己的NodeVisitor http://htmlparser.sourceforge.net/javadoc/org/htmlparser/visitors/NodeVisitor.html:

public class MyNodeVisitor extends NodeVisitor {
    public MyNodeVisitor() {
    }

    public void visitStringNode (Text string)
    {
        if (string.getText().equals("**text**")) {
            string.setText("**new text**");
        }
    }
}

然后，创建一个Parser http://htmlparser.sourceforge.net/javadoc/org/htmlparser/Parser.html，解析HTML字符串并访问返回的节点列表：

Parser parser = new Parser(htmlString);
NodeList nl = parser.parse(null);
nl.visitAllNodesWith(new MyNodeVisitor());
System.out.println(nl.toHtml());

这只是实现这一点的一种方法，非常简单。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在Java中更改HTML标签内容？的相关文章

什么时候可以在 Java 中使用 Thead.stop() ？

Thread stop 的 Java 文档听起来好像如果您调用 Thread stop 世界就会终结已弃用这种方法本质上是不安全的停止线程 Thread stop 导致它解锁所有已锁定的监视器作为未经检查的 ThreadDeath
自动生成Flyway的迁移SQL

当通过 Java 代码添加新模型字段等时 JPA Hibernate 的自动模式生成是否可以生成新的 Flyway 迁移捕获自动生成的 SQL 并将其直接保存到新的 Flyway 迁移中以供审查编辑提交到项目存储库这将很有用预
如何检测 Java 字符串中的 unicode 字符？

假设我有一个包含的字符串我如何找到所有这些 un icode 字符我应该测试他们的代码吗我该怎么做呢例如给定字符串 A X 我想将其转换为 AYXY 我想对其他 unicode 字符做同样的事情并且我不想将它们存储在某种翻译映
如何适应特定子元素的宽度？

problem 我正在尝试创建一个技能表我无法问下一个问题为什么所以我创建了一个新帐户并询问当前状态我想将元素的宽度与 meter 也就是说如何设定区块的标准 meter 子元素在上面的 gif 中 img meter 我想要保
生成的序列以 1 开头，而不是注释中设置的 1000

我想请求一些有关 Hibernate 创建的数据库序列的帮助我有这个注释下面的代码在我的实体类中以便为合作伙伴表提供单独的序列我希望序列以 1000 开头因为我在部署期间使用 import sql 将测试数据插入数据库并且我希
从 GitHub 上托管的 Spring Cloud Config Server 访问存储库的身份验证问题

我在 GitHub 上的存储库中托管配置如果我将回购公开一切都好但如果我将其设为私有我将面临 org eclipse jgit errors TransportException https github com my user m
扩展位置绝对div超出溢出隐藏div

我已经好几个月没有做过CSS了所以我可能会错过一些简单的东西但无论解决方案是什么我都无法弄清楚所以问题就在这里这是我的代码的简化版本 div style height 100 width 200px div style margi
Java：如何为山区时间创建 TimeZone 对象？

必须不禁用夏令时嗯在这个清单 http en wikipedia org wiki List of tz database time zones在 zoneinfo 时区名称中有很多声称是山地时间找到最适合您想要的那个然后使用它
内部存储的安全性如何？

我需要的对于 Android 我需要永久保存数据但也能够编辑并且显然是读取它用户不应访问此数据它可以包含诸如高分之类的内容用户不得对其进行编辑我的问题我会并且已经使用过Internal Storage 但我不确定它实际
如何在php中使用preg添加html属性

我正在寻找在 php 中编写一个脚本来扫描 html 文档并根据它找到的内容向元素添加新标记更具体地说我是扫描文档并为每个元素搜索CSS标记 float right left 如果找到它它会添加align right left 基于它
Docker 和 Eureka 与 Spring Boot 无法注册客户端

我有一个使用 Spring Boot Docker Compose Eureka 的非常简单的演示我的服务器在端口 8671 上运行具有以下应用程序属性 server port 8761 eureka instance prefer i
如何在 Java 中创建接受多个值的单个注释

我有一个名为 Retention RetentionPolicy SOURCE Target ElementType METHOD public interface JIRA The Key Bug number JIRA referenc
java库维护数据库结构

我的应用程序一直在开发所以偶尔当版本升级时需要创建更改删除一些表修改一些数据等通常需要执行一些sql代码是否有一个 Java 库可用于使我的数据库结构保持最新通过分析类似 db structure version 信息并执
如何让div与包含td的高度相匹配？

我沿着桌子的一排布置了三个面板一个比另外两个高我希望所有三个面板都与最高的一个的高度相匹配我尝试将 div 的样式设置为 height 100 但是即使包含的 tds 增长短面板仍然很短我的 HTML 是由 JSF 生成的因此
Resteasy 可以查看 JAX-RS 方法的参数类型吗？

我们使用 Resteasy 3 0 9 作为 JAX RS Web 服务最近切换到 3 0 19 我们开始看到很多RESTEASY002142 Multiple resource methods match request警告例如我们
HTML 输入 - 名称与 ID [重复]

这个问题在这里已经有答案了使用 HTML 时
如何重新启动死线程？ [复制]

这个问题在这里已经有答案了有哪些不同的可能性可以带来死线程回到可运行状态如果您查看线程生命周期图像就会发现一旦线程终止您就无法返回到新位置 So 没有办法将死线程恢复到可运行状态相反您应该创建一个新的 Thread 实例
org.apache.commons.net.io.CopyStreamException：复制时捕获 IOException

我正在尝试使用以下方法中的代码将在我的服务器中创建的一些文件复制到 FTP 但奇怪的是我随机地低于错误我无法弄清楚发生了什么 Exception org apache commons net io CopyStreamException
将 Apache Camel 执行器指标发送到 Prometheus

我正在尝试转发添加 Actuator Camel 指标 actuator camelroutes 将交换交易数量等指标发送到 Prometheus Actuator 端点有没有办法让我配置 Camel 将这些指标添加到 Promet
Java EE 目录结构

我对以下教程有疑问 http www mkyong com jsf2 jsf 2 internationalization example http www mkyong com jsf2 jsf 2 internationalizatio

随机推荐

如何在 Rails 2.3.5 中安装/使用 Devise？

我尝试从 Github 上 Devise 的 v 1 2 oauth 分支进行安装但仍然出现错误如何在 Rails 2 3 5 应用程序上安装 devise gem 我特别想要一个可以与omniauth一起使用的 gem install
Mac App Store：放弃 32 位支持转而支持 ARC，32 位版本的现有用户会看到更新消息吗？

我正在考虑放弃 32 位支持转而支持自动引用计数仅支持 64 位二进制文件我想在 Mac App Store 中避免出现这两种情况 For a 旧 32 位 Mac 用户谁购买了支持 32 位的先前版本他们会在 Mac App
Python 中是否有用于纯文本文件的本机模板系统？

我正在寻找用于将输出格式化为简单文本的 Python 技术或模板系统我需要的是它将能够迭代多个列表或字典如果我能够将模板定义到单独的文件如output templ 中而不是将其硬编码到源代码中那就太好了作为我想要实现的简单示例我
如何从9GAG获取数据json

也许你认为这是一个愚蠢的问题但我希望你能给我一些建议我的问题当我查看 9gag com 的源代码时我意识到他们有一些行代码来加载更多内容 div class loading a class btn badge load more p
PyYAML 中的数组没有缩进或空格

在下面的代码中我创建了net plan dict变量字典并将其转换为YAML格式文件在字典里我有一个叫做addresses这是一个由三个元素组成的数组创建YAML文件后这三个数组元素没有放置在addresses field impor
JPA针对不同数据库的不同列类型

是否可以根据使用的数据库使用 JPA 定义不同的列类型我需要将 id 存储为 uuid 并且它必须是可移植的那就是问题所在 PostgreSQL有 uuid MSSQL有 uniqueidentifier 而Oracle什么都没有我想
android中textview的圆角

我有一个文本视图希望它的角是圆形的我已经知道可以使用android background drawable somefile 就我而言该标签已包含在内因此无法再次使用例如android background drawable my
Rails 更改 form_for 中提交的路由

我有一个模型文章和一个嵌套在文章中的模型评级文章 123 评级我想更改 ratings form html erb 中 f submit 的路由现在是这样按提交后我的申请路由到评分 111 但我想将其路由到文章 123
WCF 服务应该返回 EntityObject 还是 POCO/DTO 类？

我一直在查看很多使用 EntityFramework 的 WCF 示例其中大多数似乎都会向客户端返回某种 POCO 或 DTO 类我想知道为什么这是默认的EntityObject包括 DataContract 属性和工具INotifyP
Angula2 Karma 无法加载“webpack”！

我已经在 Angular2 项目 Webpack Karma 上工作了几个月该项目基于此入门程序的稍旧版本 https github com preboot angular2 webpack https github com preboo
带注入的定制 Serilog 水槽？

我创建了一个简单的 Serilog 接收器项目如下所示 namespace MyApp Cloud Serilog MQSink public class MessageQueueSink ILogEventSink private re
无法使用@Value在Spring应用程序中获取maven project.version属性

如何使用 Value注释在Spring Boot应用程序中获取maven project version属性经过一些关于如何在 SpringBoot 应用程序中获取 Maven 项目版本的研究和试验后我找不到任何适合我的东西由于类加载
为 Goldschmidt 部门挑选良好的初步估计

我正在计算 Q22 10 中的定点倒数戈德施密特师 http en wikipedia org wiki Division digital Goldschmidt division用于我的 ARM 上的软件光栅器只需将分子设置为 1 即可
实体 .ToList() 生成 System.OutOfMemoryException

我有一个包含 50 万行的表我需要更新每一行但 ToList 失败 List
数组访问可以优化吗？

也许我被我的分析器 Netbeans 误导了但我看到了一些奇怪的行为希望这里有人可以帮助我理解它我正在开发一个应用程序它大量使用相当大的哈希表键是长整型值是对象内置的 java 哈希表特别是 HashMap 的性能非常差在
SonarQube 临时磁盘空间

我发现 SonarQube 正在使用lot其临时目录中的磁盘空间是否有某种定期运行的清理程序来清除它 opt codehaus releases sonarqube sonarqube 5 1 temp 29 7GiB tmp
UIViewController调用对方的delegate

我有两个 UIViewController 每个都有它的委托并且正在调用其中一个一个类称为 TopicViewController 另一个类称为 MentionViewController 代码如下所示 import
JavaScript 中比较 null 与 undefined 的速度

我刚刚运行了一个非常简单的 JavaScript性能测试 http jsperf com js coerce null 不要问为什么该测试声明了一个变量但没有为其分配任何内容 var x 然后它比较比较值变量的速度null 并undef
Rails 3 / Devise：不再创建密码盐？

我已经在一个项目上工作了一段时间该项目使用 Devise 进行用户身份验证每当创建用户时它都会为他们生成密码盐及其加密密码当我进入这个项目的尾声时我正在测试用户注册并注意到我的新角色没有在数据库中为这些新用户创建密码盐而我的旧
如何在Java中更改HTML标签内容？

如何更改Java中标签的HTML内容例如 before div text div text div text div after div text div new text div text div 我尝试过 JTidy 但不支持getT

如何在Java中更改HTML标签内容？

如何在Java中更改HTML标签内容？ 的相关文章

随机推荐

热门标签

如何在Java中更改HTML标签内容？的相关文章