可以检测页面抓取吗?

2024-01-15

所以我刚刚创建了一个为我执行页面抓取的应用程序,并运行它。效果很好。我想知道是否有人能够弄清楚代码正在被页面抓取,无论他们是否为此目的编写了代码?

我用java编写了代码,它几乎只是检查一行html代码。

我想在向该程序添加更多代码之前我应该​​对此有所了解。我的意思是它很有用,但它几乎就像一个黑客。

看起来最坏的情况是因为这个页面抓取工具并不算太糟糕,因为我稍后可以使用另一个设备,并且 IP 会有所不同。而且一个月后可能就不重要了。无论如何,该网站目前似乎获得了相当多的网络流量。编辑该页面的人现在可能已经睡着了,此时它实际上还没有完成任何事情,因此这可能会被忽视。

感谢您如此快速的回复。我认为这可能被忽视了。我所做的只是复制标题,所以只是文本。我想这可能类似于浏览器复制粘贴的工作原理。该页面今天早上刚刚编辑,包括我想要获取的文本。如果他们确实注意到了什么,他们也没有宣布,所以一切都很好。


这是一个黑客行为。 :)

无法以编程方式确定页面是否被抓取。但是,如果您的抓取工具变得流行或者您使用过多,则很有可能通过统计方式检测到抓取行为。如果您看到一个 IP 每天在同一时间抓取同一页面或多个页面,您就可以做出有根据的猜测。如果您在另一个计时器上看到请求,则相同。

如果可以的话,您应该尝试遵守 robots.txt 文件,并限制自己的速率,以保持礼貌。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

可以检测页面抓取吗? 的相关文章

  • 将引导程序中的表单居中不起作用[重复]

    这个问题在这里已经有答案了 我试图将我的表单置于 div 中 但我使用的方法不起作用 我尝试使用引导文档中所述的 justify content center 属性 但它没有将其居中 当我尝试将其居中但应用时display flex and
  • 将非 Android 项目添加到 Android 项目

    我在 Eclipse 中有三个项目 Base Server 和 AndroidClient Base和Server是Java 1 7项目 而AndroidClient显然是一个android项目 基础项目具有在服务器和 Android 客户
  • 如何在 Spring 中使 @PropertyResource 优先于任何其他 application.properties ?

    我正在尝试在类路径之外添加外部配置属性资源 它应该覆盖任何现有的属性 但以下方法不起作用 SpringBootApplication PropertySource d app properties public class MyClass
  • 在Java中运行bat文件并等待

    您可能会认为从 Java 启动 bat 文件是一项简单的任务 但事实并非如此 我有一个 bat 文件 它对从文本文件读取的值循环执行一些 sql 命令 它或多或少是这样的 FOR F x in CD listOfThings txt do
  • 如何将 HTML 链接放入电子邮件正文中?

    我有一个可以发送邮件的应用程序 用 Java 实现 我想在邮件中放置一个 HTML 链接 但该链接显示为普通字母 而不是 HTML 链接 我怎样才能将 HTML 链接放入字符串中 我需要特殊字符吗 太感谢了 Update 大家好你们好 感谢
  • 在 Java 中获取并存储子进程的输出

    我正在做一些需要我开始子处理 命令提示符 并在其上执行一些命令的事情 我需要从子进程获取输出并将其存储在文件或字符串中 这是我到目前为止所做的 但它不起作用 public static void main String args try R
  • 更改 CSS 网格中的列顺序

    我正在研究 CSS 网格 当我在桌面尺寸上查看它时 min width 769px 我有单行三列 像这样的事情 col 1 col 2 col 3 我可以使用 css grid 移动列 以便我可以在移动布局上执行类似以下操作吗 col 1
  • 轻松的反应

    我有一个与这里描述的类似的案例 动态更改RESTEasy服务返回类型 https stackoverflow com questions 3786781 dynamically change resteasy service return
  • 部署 .war 时出现 Glassfish 服务器错误:部署期间发生错误:准备应用程序时出现异常:资源无效

    我正在使用以下内容 NetBeans IDE 7 3 内部版本 201306052037 爪哇 1 7 0 17 Java HotSpot TM 64 位服务器虚拟机 23 7 b01 NetBeans 集成 GlassFish Serve
  • 将 JScrollPane 添加到 JFrame

    我有一个关于向 Java 框架添加组件的问题 我有一个带有两个按钮的 JPanel 和一个添加了 JTable 的 JScrollPane 我想将这两个添加到 JFrame 中 我可以将 JPanel 添加到 JFrame 或将 JScro
  • 手动设置Android Studio的JDK路径

    如何为 Android Studio 使用自定义 JDK 路径 我不想弄乱 PATH 因为我没有管理员权限 是否有某个配置设置文件允许我进行设置 如果您查看项目设置 您可以从那里访问 jdk 在标准 Windows 键盘映射上 您可以在项目
  • CSS:如何在模糊的背景上剪切文本?

    我想重新创建以下样式 我想出了以下内容 问题是剪切不会影响模糊滤镜 我不知道如何解决它 这是我的 HTML 代码 glass width 40 height 100 position absolute background rgba 255
  • 在java中以原子方式获取多个锁

    我有以下代码 注意 为了可读性 我尽可能简化了代码 如果我忘记了任何关键部分 请告诉我 public class User private Relations relations public User relations new Rela
  • java XMLSerializer 避免复杂的空元素

    我有这个代码 DocumentBuilderFactory factory DocumentBuilderFactory newInstance DocumentBuilder builder factory newDocumentBuil

  • 有多少像素? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 一个有多少像素 br 标签添加 我知道 br 高度可以通过CSS控制line height财产 不同浏览器的值是否相同 它会添加与浏览
  • Java 正则表达式中的逻辑 AND

    是否可以在 Java Regex 中实现逻辑 AND 如果答案是肯定的 那么如何实现呢 正则表达式中的逻辑 AND 由一系列堆叠的先行断言组成 例如 foo bar glarch 将匹配包含所有三个 foo bar 和 glarch 的任何
  • div 之间的额外空间从何而来?

    http www lethalmonk6 byethost24 com index html http www lethalmonk6 byethost24 com index html 如果您使用 firebug 检查 项目链接 div
  • 简单的颜色变化

    我正在创建一个用户界面 用户可以在其中更改页面的颜色值 我想要的是获取分配给其背景颜色的值并将其变亮一定程度 我只是想获得一条亮点线 而不必每次都制作新图像 示例 用户将背景颜色设置为 ECECEC 现在我希望某个元素边框变成 F4F4F4
  • Java 11 - 将 Spring @PostConstruct 替换为 afterPropertiesSet 或使用 initMethod

    我正在使用 spring 应用程序 有时会使用 PostConstruct用于代码和测试中的设置 看来注释将被排除在外Java 11 https www baeldung com spring postconstruct predestro
  • 角度 ng-repeat 根据条件添加样式

    我在 div 列表上使用 ng repeat 并且在渲染此 div 的 json 中手动添加项目 我需要定位我在 json 中添加的最后一个 div 它会自动在屏幕上渲染 即 couse 光标所在的位置 其余部分保持在相同位置 但没有给出渲

随机推荐

  • 你会写 seq x x 吗?

    我不太清楚 seq 在 Haskell 中是如何工作的 看来在很多情况下写起来很有用 seq x x 甚至可以定义一个函数 strict x seq x x 但这样的功能还不存在 所以我猜这种方法在某种程度上是错误的 有人可以告诉我这是否有
  • 列表框鼠标悬停背景颜色

    我遇到的问题是 MouseOver 触发器在选定的行上为背景着色失败 对于任何未选定的行 鼠标悬停时背景会变成蓝色 但所选行没有蓝色背景 单击一行 然后蓝色背景消失 我还尝试了 ListBox ItemContainerStyle 中的样式
  • XmlDocument.WriteTo 截断生成的文件

    尝试将 XmlDocument 序列化为文件 XmlDocument 相当大 但是 在调试器中我可以看到 InnerXml 属性中包含所有 XML blob 它没有被截断 以下是将 XmlDocument 对象写入文件的代码 Write t
  • 聊天应用程序:node.js 还是 APE?

    我想创建一个聊天应用程序 它将使用 php codeigniter 来执行视图和用户界面 我在 stackoverflow 上阅读了很多推荐 node js 或 socket io 的帖子 但我也遇到过 APE Ajax Push Engi
  • C 中二维数组的内存映射

    你觉得什么这次讨论 http www mattababy org belmonte Teaching CCC CrashCourseC html关于二维数组的内存映射是否正确 尤其是这张照片 http www mattababy org b
  • 如何在 cakephp 中设置 cron 作业?

    我如何使用 cakephp 中的 cron 作业来调用 Ubuntu 上控制器的操作 我试图通过 crontab 来完成它 但它不起作用 使用外壳 在 cron 作业中使用 CakePHP 应用程序的 Cake Way 是创建 shell
  • 抽象类中的公共构造函数是代码吗? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 抽象类中的公共构造函数是代码吗 将构造函数设置为受保护可以提供您可以使用的所有访问权限 使其成为公共将提供的唯一额外访问权限是允许将类的实例声明
  • 如何导入 require.cache 和 require.resolve

    因为我在 package json 中使用模块类型或import而不是要求 我如何导入 require cache 和 require resolve 我正在尝试重新加载文件并更新所做的更改 error require is not def
  • Scala 类型(推理)问题?

    我正在 Scala 中使用以下方法开发 REST Web 服务Jersey http jersey java net JAX RS 参考实现 我收到一个奇怪的错误 我正在尝试创建一个内容配置 http jersey java net non
  • 更改单元格中部分文本的字体颜色

    我的单元格将包含以下值 Image not allowed png 我想改变颜色 png独自一人或之后发生的任何事情 现在我尝试使用下面的代码更改字体颜色 Cells 4 2 Font Color RGB 255 50 25 它将更改整个单
  • 在包含 AudioToolbox 框架的 Objective-C iOS 项目中找不到 AudioServices.h

    根据苹果文档 AudioServices h应该是AudioToolbox框架的一部分 尽管我已将 AudioToolbox 框架添加到我的 Xcode 项目中 但当我 import AudioServices 时 我收到错误 未找到 Au
  • 在 foreach 中强制转换为数组是否被认为是一种不好的做法?

    在启动 foreach 循环时转换为数组是否被认为是一种不好的做法 像这样的事情 foreach array examples as example Do stuff 这可以防止 为 foreach 提供的参数无效 免于发生 或者首先检查它
  • 如何使用Keras API提取“从输入层到隐藏层”和“从隐藏层到输出层”的权重?

    我是 Keras 新手 我正在尝试获取 Keras 中的权重 我知道如何在 Python 中的 Tensorflow 中执行此操作 Code data np array attributes int64 target np array la
  • MatMul 运算在张量流中如何工作?

    我注意到张量流中定义的 MatMul 运算 形状函数 Status MatMulShape shape inference InferenceContext c ShapeHandle a TF RETURN IF ERROR c gt W
  • 如何更改Mongo文档中嵌套字段的数据类型?

    我的 Mongo 结构如下 topProcesses cpuUtilizationPercent 0 0 processId 1 memoryUtilizationPercent 0 1 command init user root cpu
  • Firefox 中保存的密码发送空字段

    我在保存浏览器凭据时遇到问题 我第一次使用应用程序登录时 浏览器要求我保存字段 我按 确定 但是当我第二次登录并且浏览器使用保存的凭据填写表单字段时 我按登录 浏览器发送不带参数的请求 HTML div div
  • 如何使用所有处理器在 MPI 中发送/接收

    该程序使用 C Lagrange 和 MPI 编写 我是 MPI 新手 想要使用所有处理器进行一些计算 包括进程 0 为了学习这个概念 我编写了以下简单程序 但是这个程序在接收到进程0的输入后挂在底部 并且不会将结果发送回进程0 inclu
  • 通知图标在通知托盘上为白色

    我的通知托盘上的应用程序图标在 Android 5 上变成白色 我见过这个Android 5 Lollipop 中通知栏图标变白 https stackoverflow com questions 28387602 notification
  • 如何在 Windows 窗体应用程序中创建 Alt 快捷方式?

    我想为 Windows 窗体应用程序中的某些控件创建键盘快捷键 Example 注意带下划线的 F E V P B I have a label and a textbox control I d like to associate tha
  • 可以检测页面抓取吗?

    所以我刚刚创建了一个为我执行页面抓取的应用程序 并运行它 效果很好 我想知道是否有人能够弄清楚代码正在被页面抓取 无论他们是否为此目的编写了代码 我用java编写了代码 它几乎只是检查一行html代码 我想在向该程序添加更多代码之前我应该