使用正则表达式,获取网站 HTML 并查找此标记内的值(或与此相关的任何属性值)的最简单方法是什么:
<html>
<head>
[snip]
<meta name="generator" value="thevalue i'm looking for" />
[snip]
取决于您需要构建的 Http 请求的复杂程度(身份验证等)。这是我过去见过的一种简单方法。
StringBuilder html = new StringBuilder();
java.net.URL url = new URL("http://www.google.com/");
BufferedReader input = null;
try {
input new BufferedReader(
new InputStreamReader(url.openStream()));
String htmlLine;
while ((htmlLine=input.readLine())!=null) {
html.appendLine(htmlLine);
}
}
finally {
input.close();
}
Pattern exp = Pattern.compile(
"<meta name=\"generator\" value=\"([^\"]*)\" />");
Matcher matcher = exp.matcher(html.toString());
if(matcher.find())
{
System.out.println("Generator: "+matcher.group(1));
}
编译时可能会发现很多拼写错误。
(希望这不是作业)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)