我正在尝试从网页解析 android 中的 HTML,由于该网页格式不正确,我得到SAXException
.
Android 有没有办法解析 HTML?
我刚刚遇到这个问题。我尝试了一些东西,但决定使用JSoup http://jsoup.org/。 jar大约有132k,有点大,但是如果你下载了源码并取出一些你不会使用的方法,那么它就没有那么大了。
=> 它的好处是它可以处理格式错误的 HTML
这是他们网站上的一个很好的例子。
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
//http://jsoup.org/cookbook/input/load-document-from-url
//Document doc = Jsoup.connect("http://example.com/").get();
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)