我正在尝试使用 SAX 解析器解析普通的 html 文件。
SAXBuilder builder2 = new SAXBuilder();
try {
Document sdoc = (Document)builder2.build(readFile);
NodeList nl=sdoc.getElementsByTagName("body");
System.out.println("nodelist>>>>>>>>>>>"+nl.getLength());
} catch (JDOMException e1) {
e1.printStackTrace();
}
但我得到了例外
Open quote is expected for attribute "{1}" associated with an element type "class".
谁能告诉我为什么我会收到此异常,html 文档格式良好,并且正确地包含所有打开和关闭标记。
提前致谢。
正如 flash 所说,您需要一个 HTML 解析器,而不是 XML 解析器。 HTML 不是 XML。
我用过的好的解析器是Neko http://nekohtml.sourceforge.net/ and TagSoup http://vrici.lojban.org/~cowan/XML/tagsoup/。 Neko 是一个优秀的全能解析器; TagSoup 的具体目标是能够解析任何内容,无论格式多么不正确。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)