这个机器人不尊重nofollow noindex
在robots.txt中。
我在 robots.txt 中有这个:
User-agent: Msnbot
Disallow: /
User-Agent: Msnbot/2.0b
Disallow: /
到目前为止,它还很慢,但现在,它是一个根本不会离开我的网站的怪物。
24/7 抓取所有 WordPress 和 MyBB。
要阻止 IP 范围,或者我可以采取什么措施来阻止所有这些内容窃取者?
基于被用户代理或空引用者阻止你可以在 .htaccess 中添加类似的内容
Options +FollowSymlinks
RewriteEngine On
RewriteBase /
SetEnvIfNoCase User-Agent "^Msnbot" ban_agent
Deny from env=ban_agent
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)