我正在尝试解析以下 URL 的 html:
http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050- Thermal-energy-fall-2002/ http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/
获取包含讲师姓名的“”标签的文本。所需的信息位于“”标签内,但我无法使用 JSoup 检索标签。我不知道我做错了什么,因为当我将标签保存在 Element 对象中时,我们将其称为“b”,并且我调用 b.getAllElements() 它不会显示
作为要素之一。这不是 Jsoup 的 getAllElements() 方法所做的吗?如果没有,请有人向我解释一下我显然缺少的层次结构,因为解析器无法找到
标签包含我需要的文本,在本例中是“Zoltan Spakovszky 教授”。
任何帮助将不胜感激。
public void getHomePageLinks()
{
String html = "http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/";
org.jsoup.nodes.Document doc = Jsoup.parse(html);
Elements bodies = doc.select("body");
for(Element body : bodies )
{
System.out.println(body.getAllElements());
}
}
输出是:
http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050- Thermal-energy-fall-2002/ http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/
它不是应该打印出文档中 body 标记内的所有元素吗?
我对 JSoup 一无所知,但似乎如果您想要讲师的名字,您可以通过以下方式访问它:
Element instructor = doc.select("div.chpstaff div p");
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)