可能的重复:
Java:如何像 HttpUtility.HtmlDecode 一样解码 Java 中的 HTML 字符实体?
我需要提取段落(例如title
在 StackOverflow 中)html
file.
我可以在 Java 中使用正则表达式来提取我需要的字段,但我必须这样做decode
获得的字段。
EXAMPLE
提取字段:
Paging Lucene's search results (with **;** among **'** and **s**)
解码后的字段:
Paging Lucene's search results
java中有没有类可以让我转换这些html代码?
使用提供的方法阿帕奇公共语言
import org.apache.commons.lang.StringEscapeUtils;
// ...
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)