我正在尝试提取网页 A 的内容。使用 groovy 我尝试了以下操作
......
String urlStr = "url-of-webpage-A"
String pageText = urlStr.toURL().text
//println pageText
.....
上面的代码只要不重定向到其他网页 B,就会检索网页 A 的文本。如果 A 重定向到 B,则在 pageText 变量中检索网页 B 的页面内容。有没有办法编码并检查网页 A 是否重定向到其他网页(在 groovy 或 java 中)?
PS:上面这段代码不是服务器端逻辑的一部分。我在桌面应用程序范围内的客户端执行它。
在Java中你可以使用URL.openConnection()
得到一个HttpURLConnection(你需要投射)。关于这个你可以打电话setInstanceFollowRedirects(false).
然后你可以使用getResponseCode()看看是否HTTP_MOVED_PERM (301), HTTP_MOVED_TEMP(302)或HTTP_SEE_OTHER(303)。它们都表示重定向。
如果您需要知道where您将被重定向到,然后您可以使用getHeaderField("Location")获取位置标头。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)