我需要使用 jsoup 从此 html 中提取图像标签
<div class="picture">
<img src="http://asdasd/aacb.jpgs" title="picture" alt="picture" />
</div>
我需要提取这个 img 标签的 src ...
我正在使用此代码,但我得到空值
Element masthead2 = doc.select("div.picture").first();
String linkText = masthead2.outerHtml();
Document doc1 = Jsoup.parse(linkText);
Element masthead3 = doc1.select("img[src]").first();
String linkText1 = masthead3.html();
下面是获取图像源属性的示例:
public static void main(String... args) {
Document doc = Jsoup.parse("<div class=\"picture\"><img src=\"http://asdasd/aacb.jpgs\" title=\"picture\" alt=\"picture\" /></div>");
Element img = doc.select("div.picture img").first();
String imgSrc = img.attr("src");
System.out.println("Img source: " + imgSrc);
}
The div.picture img
选择器查找 div 下的图像元素。
元素的主要提取方法有:
-
attr(name)
,获取元素属性的值,
-
text()
,它获取元素的文本内容(例如在<p>Hello</p>
, text() 是“你好”),
-
html()
,它获取元素的内部 HTML (<div><img></div>
html()=<img>
), and
-
outerHtml()
,它获取一个元素的完整 HTML (<div><img></div>
html()=<div><img></div>
)
您不需要像当前示例中那样重新解析 HTML,要么使用更具体的选择器首先选择正确的元素,要么点击element.select(string)
方法进行筛选。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)