我必须解析一些html并删除锚标记,但我需要保留锚标记的innerHTML
例如,如果我的 html 文本是:
String html = "<div> <p> some text <a href="#"> some link text </a> </p> </div>"
现在我可以解析上面的 html 并在 jsoup 中选择一个标签,如下所示,
Document doc = Jsoup.parse(inputHtml);
//this would give me all elements which have anchor tag
Elements elements = doc.select("a");
我可以通过以下方式删除所有这些
element.remove()
但它会删除从开始括号到结束括号的完整锚标记,并且内部 html 将丢失,如何保留仅删除开始和结束标记的内部 HTML。
另外,请注意:我知道有一些方法可以获取 externalHTML() 和
来自元素的innerHTML(),但这些方法只给我提供了方法
检索文本,remove() 方法删除完整的 html
标签。有什么方法可以只删除外部标签
并保留innerHTML?
预先非常感谢并感谢您的帮助。
--Rajesh
使用 unwrap,它保留内部 html
doc.select("a").unwrap();
检查 api 文档以获取更多信息:
http://jsoup.org/apidocs/org/jsoup/select/Elements.html#unwrap%28%29 http://jsoup.org/apidocs/org/jsoup/select/Elements.html#unwrap%28%29
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)