URL 中的 ^ 符号是什么意思?
我需要从网页上抓取一些链接数据,我使用了一个简单的手写 PHP 爬虫。爬虫通常工作正常;然后我来到一个像这样的网址:
http://www.example.com/example.asp?x7=3^^^^^select%20col1,col2%20from%20table%20where%20recordid%3E=20^^^^^
在浏览器中输入此 URL 时工作正常,但我的爬网程序无法检索此页面。我收到“HTTP 请求失败错误”。
^
应对字符进行编码,请参阅RFC 1738 统一资源定位符 (URL) http://www.ietf.org/rfc/rfc1738.txt:
其他字符不安全,因为
网关和其他运输代理
已知有时会修改此类
人物。这些字符是“{”,
“}”、“|”、“\”、“^”、“~”、“[”、“]”、
和“`”。
所有不安全字符必须始终
被编码在 URL 中
您可以尝试 URL 编码^
特点。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)