如何使用Java解码html代码? [复制]

2023-11-27

可能的重复:
Java:如何像 HttpUtility.HtmlDecode 一样解码 Java 中的 HTML 字符实体?

我需要提取段落(例如title在 StackOverflow 中)html file.

我可以在 Java 中使用正则表达式来提取我需要的字段,但我必须这样做decode获得的字段。

EXAMPLE

提取字段:

Paging Lucene&#39s search results (with **;** among **&#39** and **s**)

解码后的字段:

Paging Lucene's search results

java中有没有类可以让我转换这些html代码?


使用提供的方法阿帕奇公共语言

import org.apache.commons.lang.StringEscapeUtils;
// ...
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用Java解码html代码? [复制] 的相关文章

  • 如何注册 org.springframework.integration.monitor.IntegrationMBeanExporter

    根据http www ibm com support knowledgecenter en SS7K4U 8 5 5 com ibm websphere nd multiplatform doc ae cspr data access tr
  • 竞争条件和 Clojure Atoms

    clojure atom 的文档指出 Changes to atoms are always free of race conditions 然而 竞争条件不仅是根据更改定义的 而且是在不同线程中并行逻辑操作的上下文中定义的 我想知道 保证
  • 如何防止我的 servlet 被其他网站调用

    好的 我有一个像这样的简单的 servlet public class SimpleServlet extends HttpServlet public void doPost HttpServletRequest req HttpServ
  • 字符串 a == 字符串 b 的规则 [重复]

    这个问题在这里已经有答案了 我试图了解字符串池的工作原理以及一个字符串等于另一个字符串的规则是什么 例如这个片段 public static void main String hi String s1 lol String s2 lol S
  • 列表项的替代背景颜色

    我有一个列表 每个项目都是链接的 有没有办法可以替换每个项目的背景颜色 ul li a href link Link 1 a li li a href link Link 2 a li li a href link Link 3 a li
  • URL 的正则表达式

    我已经编写了正则表达式来验证 URL 它可以是这样的 example com www example com http www example com http www example com https www example com h
  • java springrabbit - 优雅地拒绝消息

    我有以下侦听器方法 Override public void onMessage Message message Channel channel try do something bad catch Exception e try long
  • 图像未完整显示在身体背景上

    例子 http jsbin com opokev 20 http jsbin com opokev 20 完整图片 http i53 tinypic com 347a8uu jpg http i53 tinypic com 347a8uu
  • String.intern() 线程安全吗

    我想在Java中使用 String intern 来节省内存 对具有相同内容的字符串使用内部池 我从不同的线程调用这个方法 这是个问题吗 对你的问题的简短回答是肯定的 它是线程安全的 但是 您可能需要重新考虑使用此工具来减少内存消耗 原因是
  • java内存不足然后退出

    我有一个必须分析大文件的软件 限制输入或提供无限内存都不是一个选择 所以我必须忍受飞行的 OOME 因为 OOME 只杀死线程 所以我的软件运行在一些糟糕的状态 从外面看一切都很好 因为进程正在运行 但在内部却是脑死亡 我想拔掉它的插头 但
  • Java 日期和 MySQL 时间戳时区

    我正在编辑一段代码 其基本功能是 timestamp new Date 然后坚持下去timestamp中的变量TIMESTAMPMySQL 表列 然而 通过调试我看到Date显示在正确时区的对象 GMT 1 当持久化在数据库上时 它是GMT
  • 使用 ProcessBuilder 启动 CMD

    我尝试使用以下代码在 Windows 中启动 CMD 应用程序 但它无法按预期工作 来自不同网站的几个示例表明 cmd 作为 ProcessBuilder 构造中的参数应该有效 我需要做什么才能让我的 Java 应用程序在 Windows
  • Java 中有类似 .NET 的 NotImplementedException 的东西吗?

    有没有类似 NET 的东西NotImplementedException在Java中 康芒斯朗 http commons apache org proper commons lang javadocs api 2 6 org apache
  • 不鼓励在Web应用程序中使用线程吗?

    我们与同事就在 Java 的 Web 应用程序中使用线程进行了激烈的讨论 他们的观点是 不建议在 Java Web 应用程序中使用线程 因为它们不受容器管理 一般来说 我对此表示同意 因为线程可能会干扰容器 但是 如果它不是 Java EE
  • 使用替换但不使用根元素的 Jaxb 继承

    我正在浏览布莱斯的博客http blog bdoughan com 2010 11 jaxb and inheritance using substitution html http blog bdoughan com 2010 11 ja
  • Twitter Bootstrap 行过滤器/搜索框

    我无法找到有关如何为 Twitter Bootstrap 创建简单搜索查询或行过滤器的教程 我已经尝试了很多 我不确定是否我做错了什么或者插件与 Bootstrap 不兼容 如果可以的话请帮忙 我试过了 document ready fun
  • SWT StyledText 有高度限制吗?

    我正在尝试创建一个应用程序 其中包含在 ScrolledComposite 中显示的 StyledText 框 我在 StyledText 框中显示大量行时遇到困难 超过 2 550 行似乎会导致问题 StyledText 框本身不能有滚动
  • 正则表达式基于组的不同替换?

    所以我对正则表达式比较陌生 并且做了一些练习 我正在玩一个简单的 混淆器 它只是寻找 dot or dot or at or at 不区分大小写 并且在匹配项之前或之后有或没有任意数量的空格 这是针对通常情况的 someemail AT d
  • 与手动搜索列表相比,Collections.binarySearch 的性能如何?

    我想知道该使用哪一个 我有一份学生名单 我想用他的名字搜索一个学生 到目前为止 我是通过迭代列表手动完成的 如下所示 for int i 0 i lt list size i Student student list get i if st
  • 如何将元素添加到通用集合

    我想知道如何将专用对象添加到通用集合中 我正在使用以下代码 Collection

随机推荐

  • 是否可以与“const fn”的结果匹配?

    我尝试过天真的方法 fn main gt Result lt Box
  • VS 2008 Intellisense 缺失:组合键绑定到当前不可用的命令

    Intellisense 已停止处理我的 aspx 文件 并且我查看了解决该问题的其他问题但没有解决方案 当我尝试格式化 aspx 文档 Ctrl K Ctrl D 时 状态栏显示 组合键已绑定到当前不可用的命令 格式文档 轮廓不再显示 我
  • 如何在保存记录之前清理数据(删除 html 标签)?

    我想知道 Rails3 是否有一种简单的方法可以在将输入数据保存到数据库之前从输入数据中删除 html 标签 现在 数据已由 HAML 在视图级别进行清理 JS 没有被执行之类的东西 但我想完全删除潜在的有害数据 基本上 我的问题是 是否有
  • 是否可以在 Gradle 中定义 Android 字符串数组资源?

    在 Android 版 Gradle 中 我试图生成与此字符串数组资源等效的内容
  • 来自扫描仪的 Java 循环/用户输入

    制作一个简单的篮球程序 我询问主队名称 本赛季有多少场比赛 然后循环询问下一场球队比赛 基本上 当我启动 do while 循环时 它效果很好 除非用户输入例如 俄亥俄州 例如 输出将从 剩余 6 场比赛 变为 剩余 4 场比赛 通常它会问
  • Pandas to_excel-如何让它更快

    我有一个包含 12 000 行和 34 列的数据框 pandas 将其写入 Excel 大约需要 15 秒 我读到了一些关于 to excel 函数的讨论 使其更快的一种方法是添加 engine xlsxwriter 我使用以下代码 wri
  • Facebook 新 iOS7 应用程序中的 UIStatusBar

    我有一个带有侧栏菜单的应用程序 有点像 Facebook 侧栏菜单 我正在使用这个名为SWRevealViewController而且效果很好 现在自从 iOS7 发布以来 我就是不知道如何调整我的状态和导航栏 就像在 Facebook 应
  • jQuery 验证插件条件必填字段

    我有一个问题jQuery 验证插件 我有一套3单选按钮 如果选择前两个中的任何一个 则会在表单上向用户显示额外的选择输入 如果选择第三个 则不会发生任何情况 我希望用户成为required如果他们从单选按钮集中选择选项 1 或 2 则可以从
  • 如何使用 SBT 运行 JUnit 4.11 测试用例?

    我有以下内容构建 sbt libraryDependencies com novocode junit interface 0 10 test libraryDependencies junit junit 4 11 test 我注意到ju
  • 具有缩放属性的 ObjectAnimator 使 bg 变黑?

    我使用 ObjectAnimator 来缩小relativelayout ObjectAnimator scaleDownX ObjectAnimator ofFloat view scaleX 0 5f ObjectAnimator sc
  • 隐藏滚动条并溢出:启用滚动

    我需要隐藏具有 Overflow scroll 的 div 上的滚动条启用后 div 将通过鼠标和键盘滚动 但滚动条本身不会显示 有没有办法用 css 来做到这一点 或者 javascript 是可行的方法 您可以使用纯 CSS 来做到这一
  • android:onClick 不适用于 ProGuard

    从今天开始 我的应用程序发生了一些奇怪的事情 每次我单击设置了 android onClick 属性的按钮时 我都会得到一个IllegalStateException 找不到方法 我注意到只有当我在文件中启用 Proguard 时才会发生这
  • Python pandas 从长转向宽

    我的数据目前采用长格式 下面是一个示例 Stock Date Time Price Year AAA 2001 01 05 15 20 09 2 380 2001 AAA 2002 02 23 10 13 24 2 440 2002 AAA
  • 支持通配符的 Python Windows 文件复制

    我一直在这样做 result subprocess call copy 123 xml out folder y if result 0 do something else do something else 直到今天我开始研究 pywin
  • 如何在 Java 中将数字格式化为固定长度、空格填充、千位分隔符、2 位小数

    如何在Java中将数字格式化为固定长度 在左侧字符串上填充空格 并用空格作为千 位分隔符 保留小数点后两位 假设是 14 个字符的字符串 I e Number 10 03 must be 10 03 and Number 1235353 9
  • R 脚本的 GUI 前端

    我们有一组 R 脚本 它们处理一些数据并产生一些结果 我们希望使这些脚本可供不习惯 R 命令行的基本用户使用 我们希望为他们提供一些漂亮的 GUI 这将允许 轻松从 MS Excel Access 导入 导出数据 如果可能 还支持复制 粘贴
  • 使用资产中的 Uri 或文件创建 MediaPlayer 时出错

    我将song mp3复制到项目的资产目录中并编写了以下代码 private MediaPlayer mp Uri uri Uri parse file android asset song mp3 mp MediaPlayer create
  • 具有应用内区域设置更改的 Android App Bundle

    当我需要从应用程序本身内部更改应用程序区域设置 即在应用程序内部进行语言更改设置 时 我遇到了 AAB 问题 问题是 AAB 只为我提供了我的设备语言资源 例如 我的设备安装了英语和法语 因此 AAb 只为我提供英语和法语的资源 但从应用程
  • Java ScheduledExecutorService BAD 精度

    您好 我编写了一个简单的程序来测试 ScheduledExecutorService schedule 函数的精度 该测试设置延迟并检查有效等待时间 该测试在运行 Linux 3 8 x86 64 的 i7 机器上执行 同时安装 OpenJ
  • 如何使用Java解码html代码? [复制]

    这个问题在这里已经有答案了 可能的重复 Java 如何像 HttpUtility HtmlDecode 一样解码 Java 中的 HTML 字符实体 我需要提取段落 例如title在 StackOverflow 中 html file 我可