Googlebots 忽略 robots.txt？ [关闭]

2024-01-27

我有一个网站，根目录中有以下 robots.txt：

User-agent: *
Disabled: /

User-agent: Googlebot 
Disabled: /

User-agent: Googlebot-Image
Disallow: /

该网站内的页面整天都被 Googlebot 扫描。我的文件或 Google 有问题吗？

它应该是Disallow:, not Disabled:.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

robotstxt

googlebot

Googlebots 忽略 robots.txt？ [关闭] 的相关文章

robots.txt 泄漏敏感信息

robots txt 泄漏敏感信息漏洞描述搜索引擎可以通过robots文件可以获知哪些页面可以爬取哪些页面不可以爬取 Robots协议是网站国际互联网界通行的道德规范其目的是保护网站数据和敏感信息确保用户个人信息和隐私不被侵犯
通过 PHP 呈现纯文本

出于某种原因我想通过 PHP 脚本提供 robots txt 我已经设置了 apache 以便 robots txt 文件请求实际上是所有文件请求到达单个 PHP 脚本我用来渲染 robots txt 的代码是 echo User
robots.txt 文件放在哪里？ [关闭]

Closed 这个问题是无关目前不接受答案 robots txt应该放在哪里 domainname com robots txt or domainname public html robots txt 我将文件放入domainname
robots.txt 的正则表达式

我正在尝试设置 robots txt 但我不确定正则表达式我有四个不同的页面全部以三种不同的语言提供我想我可以使用正则表达式而不是列出每个页面乘以 3 nav aspx page aspx changelang 可能附加一个查询字符
删除 robots.txt 后是否会产生后果？

我发布了一个网站由于不依赖于我的误解我不得不在索引之前阻止所有页面其中一些页面已经链接到社交网络上因此为了避免不良的用户体验我决定将以下代码插入到 robots txt 中 User agent Disallow 我收到了关于网站
robots.txt - 这有效吗？

我刚刚遇到了一个 robots txt 如下所示 User agent Disallow foobar User agent badbot Disallow 仅禁止所有文件夹后具体是否badbot规则是否适用注意此问题仅用于理解上述规
如何设置仅允许站点默认页面的robot.txt

假设我有一个网站http example com http example com 我真的很想让机器人看到主页但任何其他页面都需要被阻止因为它对蜘蛛来说毫无意义换句话说 http example com http example co
robots.txt URL 格式

根据这一页 http www robotstxt org robotstxt html User agent 或 Disallow 行中不支持 globbing 和正则表达式然而我注意到堆栈溢出机器人 txt https stackov
Scrapy 和 robots.txt 的尊重

我昨天发现Scrapy默认尊重robots txt文件 ROBOTSTXT OBEY True 如果我请求一个 URLscrapy shell url 如果我有回应是否意味着url不受robots txt保护根据文档只有当您使用创建项
Googlebots 忽略 robots.txt？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我有一个网站根目录中有以下 robots txt User agent Disabled User agent Googlebot Disabled
我可以在 robots.txt 中使用“Host”指令吗？

Searching for specific information on the robots txt I stumbled upon a Yandex help page http help yandex com webmaster c
任何人都可以获得任何 C# 代码来解析 robots.txt 并根据它评估 URL

简短的问题有没有人有任何 C 代码来解析 robots txt 然后根据它评估 URL 看看它们是否会被排除长问题我一直在为尚未发布到谷歌的新网站创建站点地图站点地图有两种模式用户模式如传统站点地图和管理模式管理模式将显
Googlebot 什么时候执行 JavaScript？

我在多个域上有一些单页 Web 应用程序它们严重依赖 javascript ajax 来获取和显示内容根据日志和搜索结果我可以看出 googlebot 在某些域上运行 javascript 但在其他域上则不运行在某些平台上它索引了
404 错误 - Google 尝试对 ColdFusion CFC 建立索引

几个月来我们的 IIS ColdFusion 服务器在 Google 爬虫扫描期间一直抛出 404 错误通常情况下很容易追踪这些文件但在这种情况下 Google 正在尝试扫描我们的 CFC 文件这些文件确实存在但它们不会暴露在 I
Googlebot 会抓取用 JavaScript 对 DOM 所做的更改吗？

对于 SEO 我的任务是添加一个rel nofollow 所有外部链接最简单最不显眼的添加方式rel nofollow 每个外部链接都带有一些 jQuery 我已经做得很好但我现在想知道 Google 是否会看到 jQuery 文档加
禁止在 robots.txt 中使用动态 URL

我们的网址是 http example com kitchen knife collection maitre universal cutting boards rana parsley chopper cheese slicer vege
具有大量动态子域的站点的站点地图

我正在运行一个允许用户创建子域的网站我想通过站点地图将这些用户子域提交给搜索引擎但是根据站点地图协议和 Google 网站管理员工具单个站点地图只能包含来自单个主机的 URL 最好的方法是什么目前我有以下结构站点地图索引位于
如何设置Robots.txt或Apache仅在特定时间允许爬虫？

由于 24 小时内流量分布不均匀我希望在高峰时段禁止爬虫在非繁忙时段允许爬虫有没有一种方法可以实现这一目标编辑感谢所有的好建议这是我们找到的另一个解决方案 2bits com 有一篇关于设置 IPTables 防火墙以限制来自某
尽管文件可访问，但“Lighthouse 无法下载 robots.txt 文件”

我有一个NodeJS NextJS应用程序运行于http www schandilla com http www schandillia com 该项目有一个机器人 txt文件可访问于http www schandillia com rob
使用“禁止：/*？”在 robots.txt 文件中

I used Disallow 在 robots txt 文件中禁止所有可能包含的页面在网址中该语法是否正确或者我是否也阻止了其他页面这取决于机器人遵循原始 robots txt 规范的机器人不会给出任何特殊含义这些机器人会阻

随机推荐

HttpError：<请求 https://www.googleapis.com/bigquery/v2/projects/ 时出现 HttpError 400

这是我在尝试对 bigquery 进行身份验证调用时遇到的错误 HttpError
如何使用 Javascript 添加 CSS？

如何添加 CSS 规则例如strong color red 通过使用Javascript 简单直接的方法是创建并添加一个新的style文档的节点 Your CSS as text var styles qwebirc qui ircwin
Android - java.lang.IllegalArgumentException：由通知引起的 contentIntent 必需错误？

我正在运行一项服务当它收到一条表示必须更改的消息时它会更新通知栏中的通知但是当要更新通知时有时会出现以下错误 java lang IllegalArgumentException contentIntent required 这是
找不到 com.android.tools.build:gradle:3.0.1

当我尝试使用 gradle 包装器构建项目时出现以下错误 gradlew FAILURE Build failed with an exception What went wrong A problem occurred configur
监视 Dart 中的文件更改

是否可以在 Dart 中监视文件更改删除创建编辑就像在 NodeJS 中一样我似乎无法找到这个问题的答案将来有可能实施吗你想看一下FileSystemEntity watch https api dart dev dev 2
使用 Proguard 混淆时 Gson EnumTypeAdapter 中的 AssertionError

我的项目实现了一个TypeAdapter in Gson在序列化反序列化期间保留对象的多态性状态无论如何该项目在开发测试期间运行良好但是当它发布时混淆器混淆并经过测试它只是崩溃了 03 21 10 06 53 632 E Andr
检查 SignalR 属性中的授权

我在 ServiceStack 上有一些服务并在这个项目中使用 SignalR 现在我想保护集线器连接仅对经过身份验证的用户进行访问但我使用ServiceStack框架身份验证不是asp net身份验证和ServiceStack
Excel VBA中的公共静态变量

是否可以在一个过程中声明静态变量并使用 Excel VBA 在多个不同的过程中使用该变量 i e Public myvar as integer Sub SetVar static myvar as integer myvar 999 e
使用 Maven 的部署：部署文件插件部署工件、其源代码和 javadoc

我在尝试将工件其源代码及其 javadoc 部署到我们的 Maven 存储库 Nexus 时遇到了困难源和javadoc参数似乎被忽略实际上只上传 Dfile中指定的主jar 有谁知道出了什么问题吗这是我的命令我正在尝试将 Wha
这是在 sdk 39 中使用 expo bare 工作流程在 infoplist 文件中添加字符串的方法吗？ #ReactNative

expo name Light slug Light version 1 0 0 orientation portrait icon assets icon png userInterfaceStyle automatic ios user
通过automake检查make中的环境变量

有没有办法让条件通过 automake 以便稍后将其传递到生成的 Makefile in 和 Makefile 我检查 JAVA HOME 是否在 Makefile 的环境中定义 ifeq undefined origin JAVA HOM
在Python中使用循环从列表中弹出项目[重复]

这个问题在这里已经有答案了我正在尝试在 python 中编写一个 for 循环来弹出列表中除两个之外的所有项目所以我尝试了以下方法 guest john phil andy mark frank joe for people in gu
ASP.NET MVC 会话、全局和缓存

我有一个用普通 ASP NET 编写的应用程序我想将其移植到 ASP NET MVC 然而我对保存对象的正确位置感到困惑我需要坚持有几个原因我希望所有人都能拥有一个single数据库连接包装在存储库或管理器样式对象中每个
获取第 3 方应用程序的清单文件

This 允许您浏览应用程序的清单文件它是如何做到的我在操作系统的 API 中找不到任何用于获取另一个应用程序的清单文件的内容首先您可以获得应用程序列表如下所示 PackageManager pm getActivity getP
jquery改变div文本

div class widget style height 60px width 110px n div class widget head ui widget header style height 20px width 130px sp
使用c++和qt时的重音问题

我正在用西班牙语编写一个程序我想告诉用户文件已加载用西班牙语来说是 ui gt teLog gt append Se carg el archivo filename 然而西班牙语部分的输出为归档文件我知道问题在于编码我想我需要
创建简单的自定义上下文菜单命令 - 如何使用右键单击的文件路径/名称来运行 VB 脚本？

我下载了一个文件并想验证它的 MD5 校验和 7Zip 的文件上下文菜单输出不包含 MD5 校验和因此我从 Windows 站点下载了 fciv exe 并将其复制到我的 System32 文件夹中然后我陷入了尝试添加自定义上下文菜单项
类似的 JSON 请求，但发送 null 对象

我正在 ASP NET MVC4 上进行开发我的代码中有两个提交 JSON 对象的 JSON 请求其中一个工作正常另一个由于某种原因传递了一个空值有任何想法吗注意在这两种情况下请求实际上都到达了预期的控制器只是第二个传递的是
在MySQL插入语句中使用php变量[重复]

这个问题在这里已经有答案了我正在使用以下语句但不确定如何获取 variables正确地在声明中 mysql query INSERT INTO subscribers email referral id user id ip addre
Googlebots 忽略 robots.txt？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我有一个网站根目录中有以下 robots txt User agent Disabled User agent Googlebot Disabled

Googlebots 忽略 robots.txt？ [关闭]

Googlebots 忽略 robots.txt？ [关闭] 的相关文章

随机推荐

热门标签