目前我需要一个给定 URL 的程序,返回网页上所有图像的列表。
ie:
标志.png
图库1.jpg
测试.gif
在我尝试编写代码之前是否有可用的开源软件?
语言应该是java。谢谢
菲利普
只需使用一个简单的 HTML 解析器, like jTidy, 进而按标签名称获取所有元素 img
然后收集src
a 中每个的属性List<String>
或者可能List<URI>
.
您可以获得InputStream
of an URL
using URL#openStream()然后将其提供给您喜欢使用的任何 HTML 解析器。这是一个启动示例:
InputStream input = new URL("http://www.stackoverflow.com").openStream();
Document document = new Tidy().parseDOM(input, null);
NodeList imgs = document.getElementsByTagName("img");
List<String> srcs = new ArrayList<String>();
for (int i = 0; i < imgs.getLength(); i++) {
srcs.add(imgs.item(i).getAttributes().getNamedItem("src").getNodeValue());
}
for (String src: srcs) {
System.out.println(src);
}
然而我必须承认 Bozho 建议的 HtmlUnit 确实看起来更好。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)