AFAIK,
$_SERVER['REMOTE_HOST'] 应该以“google.com”或“yahoo.com”结尾。
但这是最有保障的方法吗?
还有其他出路吗?
您通过以下方式识别搜索引擎用户代理和IP地址 http://www.jafsoft.com/searchengines/webbots.html。更多信息可以在以下位置找到如何识别搜索引擎蜘蛛和网络机器人 http://www.jafsoft.com/searchengines/spider_hunting.html。还值得注意的是这个清单 http://www.user-agents.org/。然而,您不应该将用户代理(甚至远程主机)视为必然确定的。用户代理实际上只不过是另一端告诉您的内容,当然它可以自由地告诉您任何信息。编写代码来冒充 Googlebot 很简单。
在 PHP 中,这意味着查看$_SERVER['HTTP_USER_AGENT']
and $_SERVER['REMOTE_HOST']
.
有很多搜索引擎,但老实说,一般来说,您真正关心的只是少数几个。谷歌和雅虎共同占据了几乎所有的市场。但这当然取决于您想要实现的目标。
Note:对待搜索引擎与普通用户要非常小心(就像乔尔所说的“邪恶的连字符网站”)当谈到内容时。在特别恶劣的情况下,这可能会使您的网站从该搜索引擎中删除。即使这种情况没有发生,您也可能会让一些出于期待而访问网站的用户望而却步。如果他们随后看到“请注册才能查看本文”框,那么,请感谢您的高跳出率。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)