我需要获取 pinnaclesports.com 的 HTML 源代码。问题是它检测cookie和JS是否启用,如果没有,它只是返回一些页面说
该网站需要启用 JavaScript 和 Cookie。请更改您的浏览器设置或升级您的浏览器。
使用 cURL 时有什么办法可以欺骗 JS 支持吗?
编辑:我可以使用作为 Perl/Ruby 模块运行或用 PHP 编写的无头浏览器
其他建议是设置用户代理,这个解决方案适用于我的 Google Groups 解析器:
curl -L -v "https://groups.google.com/d/forum/<GROUP-NAME>" -A "Mozilla/5.0 (compatible; MSIE 7.01; Windows NT 5.0)"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)