允许搜索机器人在没有会话 ID 的情况下抓取您的网站

2024-03-24

谷歌的 state

允许搜索机器人在没有会话 ID 或跟踪其网站路径的参数的情况下抓取您的网站。这些技术对于跟踪个人用户行为很有用，但机器人的访问模式完全不同。使用这些技术可能会导致网站索引不完整，因为机器人可能无法消除看起来不同但实际上指向同一页面的 URL。

我的 ASP.NET 1.1 站点使用自定义身份验证/授权，并且非常依赖会话 guid（类似于这种方法 http://www.15seconds.com/Issue/021119.htm）。我担心允许非会话跟踪流量会破坏我现有的代码或引入安全漏洞。

允许非会话跟踪机器人抓取正常会话跟踪的网站有哪些最佳实践？除了检查用户代理之外，还有什么方法可以检测搜索机器人（我不希望人们欺骗自己为 googlebot 来绕过我的会话跟踪）？

检测机器人的正确方法是通过主机条目（Dns.GetHostEntry）。一些蹩脚的机器人要求您通过 IP 地址进行跟踪，但流行的机器人通常不需要。 Googlebot 请求来自 *.googlebot.com。获得主机条目后，您应该签入IPHostEntry.AddressList以确保它包含原始 IP 地址。

甚至不look验证机器人时在用户代理处。

也可以看看http://googlewebmastercentral.blogspot.com/2006/09/how-to-verify-googlebot.html http://googlewebmastercentral.blogspot.com/2006/09/how-to-verify-googlebot.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

允许搜索机器人在没有会话 ID 的情况下抓取您的网站的相关文章

验证码怎么写？

我正在开发一个注册表我想放置验证码我生成一个随机字符串但如何将其转换为图像否则我如何开发验证码或任何参考谢谢 Try out 验证码 http recaptcha net plugins aspnet 或查看博客文章使用 Asp
将列添加到 ASP.NET Identity 中的 AspNetUserClaims

我在用着Microsoft AspNet Identity Core 2 2 1在我的解决方案中我需要将其与另一个应自动添加声明的系统集成为了跟踪哪些声明是手动添加的以及哪些是由外部系统创建的我希望在我的AspNetUserClaim
在asp.net中自动调用文本框textchange事件

我有一个表单从其中导航到我的表单其中有一个用于数量的文本框之前我是输入数量的现在 IO 有一个工作流程这就是其他形式出现的原因现在我已经完成了文本框文本更改事件的大量编码当我做response redirect在其他形式中
.net MVC 将 MP4 流式传输到 iDevice 问题

我一直在编写用于提供视频服务的一段代码但遇到了一些问题代码如下 public ResumingFileStreamResult GetMP4Video string videoID if User Identity IsAuthenti
PHP 和 ASP.Net 可以在 IIS 7.5 中的同一网站中一起运行吗？

我们网站的一部分是用 PHP 完成的而我们网站的一部分是用 ASP Net 完成的我们刚刚使用 Windows Server 2008 R2 设置了一个新的 Web 服务器其中安装了 IIS 7 5 我知道 IIS 7 支持 PHP
将图像文件从网址复制到本地文件夹？

我有该图像的网址例如 http testsite com web abc jpg http testsite com web abc jpg 我想将该 URL 复制到 c images 中的本地文件夹中而且当我将该文件复制到文件夹中时
(Java) 在 Mac OS X 上以编程方式访问“系统根目录”下的 SSL 证书

我正在编写一个 Java 应用程序它可以通过远程 Https 站点进行 REST Api 调用远程站点由受信任的证书签名它在 Windows 上运行良好但由于 SSL 证书问题在 OS X 上运行时遇到问题我做了一些挖掘发现原
上传的白名单或黑名单文件扩展名？

我正在制作一个新闻通讯编辑器它将允许文件上传新闻通讯的发件人可以将文件上传到将在电子邮件中链接到的服务器该站点的设置使得只有 do URI 实际由 servlet 执行处理因此不会有太大的安全风险但有人告诉我将 jsp php
在 IIS 托管的 ASP.NET Web 应用程序中打开页面时显示“找不到资源”

我正在使用 IIS 8 5 将 Web 应用程序 Net 4 5 托管到远程服务器该应用程序在本地和远程 IIS 上运行良好但是有一个页面 Reports ReportsMain aspx 导致错误找不到资源我确保该页面存在我还确
如何下载内存流文件

我是 asp net 的初学者我使用以下命令创建 pdf 文件PdfRpt http pdfreport codeplex com SourceControl BrowseLatest 我在课堂上写这段代码 namespace PdfRe
ASP.NET MVC - 授权属性登录重定向后保留 POST 数据

我有一个带有评论的博客文章页面任何用户无论是否登录都可以在页面底部看到一个表单来发表评论当用户输入评论且未获得授权时用户将被重定向到登录注册页面登录后用户将被重定向回操作但包含评论正文的 POST 数据会丢失我使用 AS
Windows 身份验证在 IISExpress 中有效，但在 IIS 中无效

我有一个奇怪的问题我正在 Visual Studio 2013 中使用最新的 MVC5 我正在尝试创建一个托管匿名 API 的站点以及一个需要通过 Windows 身份验证的 Intranet 域凭据的管理仪表板当通过 IIS Expr
Rfc2898DeriveBytes 与密码的 Sha2 哈希生成

我最近知道使用 SHA256 为加盐密码生成密码哈希在阅读了一些有关加盐密码和安全性的内容后我看到rfc2898derivebytes and passwordderivebytes NET 中的类使用有什么好处吗rfc2898der
asp.NET 2.0网站无法访问App_Code中的类

将我的网站部署到服务器后我在访问课程时遇到问题请注意这是一个网络Site不是网络应用错误是编译器错误消息 CS0246 找不到类型或命名空间名称 Order 是否缺少 using 指令或程序集引用版本信息 Microsoft N
如何从 ASP.NET 中的 DetailsView 控件获取值？

我的页面上有详细信息视图我设置DefaultMode Edit 现在我想获取用户将在此单元格中编辑的值
HTTP 403 Forbidden：访问被拒绝 ASP.NET Web API

在生产服务器上运行 ASP NET Web API 项目时我收到以下错误 403 禁止访问被拒绝您没有权限查看使用您提供的凭据访问此目录或页面查看 IIS 7 0 错误日志基本错误是 403 14 目录列表被拒绝我已经配置了生
客户端可以看到服务器端源代码吗？ ASP.NET

我想知道使用任何浏览器的任何客户端是否可以看到我的服务器端代码如果是这样我怎样才能防止这种情况发生实际上客户在访问我的网站时能够看到什么 asp net 我以前从未使用过 asp net 但我认为它与 PHP 或 Perl 相同客
ASP.NET 中继器错误：找不到类型 xx 的默认成员

这是我的 aspx 页面中的中继器控件
如何在 Asp.Net Core 6 中向类型化 HttpClient 添加承载令牌身份验证

我正在尝试使用 ASP Net Core 6 设置一个 Web api 以便用户可以到达我的端点然后我使用特权帐户在幕后的 D365 中执行一些工作我正在使用类型化的 HTTP 客户端但我不确定如何插入承载身份验证以便来自该客户端的
如何在 C# 中创建 PKCS12 .p12 文件？

这可能是一个n00b问题但我在这方面确实没有任何经验我需要创建一个包含 X509 证书和私钥的 p12 捆绑包我当前有两个对象 X509Certificate2 和包含关键信息的 RSAParameters 对象如何将它们合并到 p

随机推荐

我有一个 JApplet，它必须显示 3 个组件。（2 个 JPanel 和 1 个 Paint 方法）

我有一个作业其中我必须允许用户使用二次方程绘制图表我设法绘制了图形的骨架现在我尝试显示控制面板以供用户输入值我有4个文件 graph java panel java panelB java panelC java 我的问题是当我
如何在 debian 上安装 apcu 作为 php7 扩展

我看过这个ubuntu教程 http thereluctantdeveloper com 2015 12 quick and dirty php 70 set up on ubuntu 1404 with apcu http therelu
SQL Server 执行模拟

两者有什么区别 execute as user testuser AND execute as login testuser 我正在这些登录名下执行跨数据库过程它适用于作为登录名执行但不适用于作为用户执行这表示服务器主体 testus
编译为 C 时的垃圾收集

将垃圾收集语言编译为C时垃圾收集的技术有哪些我知道有两个维护一个影子堆栈将所有根显式保存在数据结构中使用像 Boehm 这样的保守垃圾收集器第一种技术很慢因为您必须维护影子堆栈可能每次调用函数时您都需要将局部变量保存在数据
如何使用 jQuery 获取 id 元素的一部分？

如何从 id old id 的 span 中获取一些文本并将其放入 id new id 中 span Some text span span span span Some text span span span 我不知道如何获得数字部分
4 层（对于 N 层）架构示例？

最近我的一个朋友向我询问 N 层架构我能够通过示例向他解释 1 2 和 3 层架构但当我想给出超过 3 层的例子时我就陷入了困境我用谷歌搜索并大量寻求帮助但找不到任何像样的例子事实上它被命名为 N 层这让我认为 N 可以是
使用升压间隔_map

试图遵循boost party我制作了这个示例代码 include boost icl interval hpp include boost icl interval map hpp include
为什么Python中列表元素查找的复杂度是O(1)？

今天在课堂上我们了解到从列表中检索元素是O 1 在Python中为什么会这样呢假设我有一个包含四个项目的列表例如 li perry 1 23 5 s 这些项目在内存中具有不同的大小所以不可能获取内存位置li 0 并添加每个元素大小
相似列出现的次数

我是 SQL SERVER 新手需要您的建议我有一张大桌子上面有商店信息这是 bench id 列 bench id 31 51 51 61 61 61 71 71 我创建了另一个包含两列的小表 distinct bench num
BatchGetItem 或 Query DynamoDb - 按范围查询

我有一个名为 User 的表它有一个用户 ID 的哈希键和一个组织 ID 的范围键如何返回组织 ID 为 3 的所有用户顺便说一句这是一个 Lambda 函数这段代码给了我一个错误 console log Loading even
YUY2 与 YUV 422

我无法理解两者之间的确切区别从研究来看更多地讨论两者是不同的但少数人似乎将它们分组在 4 2 2 抽样方案下 YUV 422 I 和 J 版本有一个亮度平面 Y 和 2 个色度平面 U V 然而在 I422 中色度平面蓝色和红
如何在 React.js 中解析 FOUC

我已经从 create react app 构建了react js 网站但在生产模式下存在 FOUC 因为样式是在 html 渲染后加载的有什么办法可以解决这个问题吗我一直在谷歌搜索答案但还没有找到合适的答案 FOUC FOUC
如何在WPF中绘制平滑的曲线？

我有三个已知位置目前我正在驾驶两条线路如下所示 Line line new Line StrokeThickness 3 Stroke lineColor X1 MyX Y1 MyY X2 MyX Y2 MiddleY Graph Ch
Canvas 绘制在 Safari 上需要花费大量时间，但在 Chrome 或 FF 上则不需要

我正在我的网站上制作万花筒它所做的只是获取一张图像通过拖放或加载时的默认图像并将其复制 10 次万花筒的每个切片复制一次鼠标移动时调整切片的旋转和缩放以达到所需的效果在 Google Chrome 和 Firefox 上它可
Azure 上的 ASP.NET MVC 5：对于 SVG 文件，“您正在查找的资源已被删除...”

我创建了一个包含一些视图和控制器的 MVC 5 网页添加了一些图像 gif 和 svg 并验证它主要在本地工作图像显示出来一切都按预期进行当我部署到 Azure 时 gif 图像加载正常但 svg 图像给出错误The resour
Javascript 如果对象中存在值？

我有一个对象 var car company Honda year 2011 Model Brio 我想知道是否存在继承方法这是正确的短语吗来检查给定对象中是否存在值有点像x hasOwnProperty or if x in car
为什么 JavaScript 的这两部分不等价？

在 jquery 1 4 2 ff 3 6 6 中以下代码生成三个 div 它们按照您的预期将消息写入 Firebug 控制台但是如果您取消注释循环并注释掉手动执行的 3 行则它将不起作用将鼠标悬停在任何 div 上都会导致 th
在VIM中插入到行尾

So for a long time I ve had a bad habit of going to the end of a line hitting the i key and then hitting the right arrow
includeAll path="" 在 3.5.3 中不起作用，使用 java -jar 方法

我们遇到一个主要问题即相对路径在databaseChangeLogMaster xml使用 includeAll 时的文件 includeAll 仅适用于绝对路径示例如下下面不起作用
允许搜索机器人在没有会话 ID 的情况下抓取您的网站

谷歌的 state 允许搜索机器人在没有会话 ID 或跟踪其网站路径的参数的情况下抓取您的网站这些技术对于跟踪个人用户行为很有用但机器人的访问模式完全不同使用这些技术可能会导致网站索引不完整因为机器人可能无法消除看起来不同但实际上指

允许搜索机器人在没有会话 ID 的情况下抓取您的网站

允许搜索机器人在没有会话 ID 的情况下抓取您的网站 的相关文章

随机推荐

热门标签

允许搜索机器人在没有会话 ID 的情况下抓取您的网站的相关文章