我在 Java 中有以下内容,我只想删除 html 标签而不是换行符
<p>test1 <b>test2</b> test 3 </p> //line 1
<p>test4 </p> //line 2
如果我在文本富编辑器中打开以上内容,第 1 行和第 2 行将显示在不同的行中(不显示</p>
标签)。但在记事本内容中显示</p>
标签。删除我使用的所有 html 标签
Jsoup.parse(aboveContent).text()
它删除所有 html 字符。但它在记事本中的同一行中显示所有第 1 行和第 2 行。 Jsoup 还以某种方式删除换行符。
我尝试过:-
我也尝试更换</p>
with \r\n
然后删除html标签
Jsoup.parse(contentWith\r\n-Insteadof-</p>Tag ).text()
但 Jsoup 仍然删除同一行中的行尾字符(如在调试器中我可以看到 line1 和 line2)。
如何使 Jsoup 只去除 html 字符而不去除换行符?
您还可以这样做:
public static String cleanNoMarkup(String input) {
final Document.OutputSettings outputSettings = new Document.OutputSettings().prettyPrint(false);
String output = Jsoup.clean(input, "", Whitelist.none(), outputSettings);
return output;
}
这里重要的是:
1. Whitelist.none() - 因此不允许任何标记
2..prettyPrint(false) - 所以换行符不会被删除
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)