robots.txt 泄漏敏感信息

2023-11-04

robots.txt 泄漏敏感信息

漏洞描述：

搜索引擎可以通过robots文件可以获知哪些页面可以爬取，哪些页面不可以
爬取。Robots协议是网站国际互联网界通行的道德规范，其目的是保护网站数据和敏感信
息、确保用户个人信息和隐私不被侵犯，如果robots.txt文件编辑的太过详细，反而会泄露
网站的敏感目录或者文件，比如网站后台路径，从而得知其使用的系统类型，从而有针对性
地进行利用。

测试方法：

1、检测形式多样，工具爬虫扫描得到敏感文件的路径，从而找到 robots 文件；
2、手工挖掘，直接在域名后输入/robots.txt 进行查看。
风险分析：攻击者可通过发现robots.txt文件，收集网站的敏感目录或文件，从而有针
对性的进行利用。

风险等级：

【低危】：robots.txt中存在allow和disallow的具体内容泄露敏感目录信息。
修复方案：可根据实际情况，进行如下对应的修复：
1、 User-agent: * 这里的代表的所有的搜索引擎种类，是一个通配符
2、 Disallow: / 这里定义是禁止爬寻站点所有的内容
3、 Disallow: /admin/ 这里定义是禁止爬寻 admin 目录下面的目录
4、 Disallow: /ABC/ 这里定义是禁止爬寻 ABC 目录下面的目录
5、 Disallow: /cgi-bin/.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的 URL(包
含子目录)。
6、 Disallow: /?* 禁止访问网站中所有包含问号 (?) 的网址
7、 Disallow: /.jpg$ 禁止抓取网页所有的.jpg 格式的图片
8、 Disallow:/ab/adc.html 禁止爬取 ab 文件夹下面的 adc.html 文件。
9、 Allow: /cgi-bin/ 这里定义是允许爬寻 cgi-bin 目录下面的目录
10、Allow: /tmp 这里定义是允许爬寻 tmp 的整个目录
11、Allow: .htm$ 仅允许访问以".htm"为后缀的 URL。
12、Allow: .gif$ 允许抓取网页和 gif 格式图片
13、Sitemap: 网站地图告诉爬虫这个页面是网站地图。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

安全

渗透测试

信息安全

信息泄露

robotstxt

robots.txt 泄漏敏感信息的相关文章

Linux ./configure --prefix命令

源码的安装一般由3个步骤组成配置 configure 编译 make 安装 make install 具体的安装方法一般作者都会给出文档这里主要讨论配置 configure Configure是一个可执行脚本它有很多选项使用命令 c
局域网访问本地localhost-VS2015调试WebService

两点步骤一配置IP 二 VS管理员启动配置ip 可以自定义IP 或者用自动分配的IP cmd ipconfig VS运行右键显示所有应用程序打开配置文件在
【css学习】使用css3中的var实现主题切换

一首先搭建基础的页面结构
Spring cloud项目扩展（二）项目集成redis和辅助工具hutool

最近看到了一个很好用的集成开发工具里面有很多工具类可以提高开发效率官方文档请看 https hutool cn docs 下面主要介绍一下在我们项目中加入工具并且通过这个工具使用redis 话不多说直接开始 1 在我们原有的项目的项
2021-05-05

实训3 信息加密与哈希函数实验目的理解加密系统的概念掌握经典加密的主要方法理解混淆与扩散的概念掌握DES加密的主要方法了解非对称加密的重要意义掌握RSA加密算法的主要思想与使用方法理解数字签名的作用及生成方法实验准备及注意
java声明方法抛出的异常

java声明方法抛出的异常 TestExceptions java import java io 异常 public class TestExceptions public static void main String args void

随机推荐

贵阳人文科技学院新颖的计算机毕业设计题目大全50例

最近要准备毕业设计了不会选题希望可以帮忙给一些毕业设计题目我整整花了一周把之前做的答辩通过的毕业设计成品进行整理如下列表计算机科学技术毕业设计题目推荐1 10题 1 Springboot美食网站92nn7 2 Springboot基
Adb connection Error:远程主机强迫关闭了一个现有的连接

小编遇到这个烦人的问题总是一直报错浏览了许多网页总结了以下几种解决方法这些都是转载加上自己的见解这里本人是用最后一种搞定的不过有时候需要进入paltform tools目录下因为没有PATH路径注意这种方法需要启动虚拟记得就
Stable Diffusion公司重磅开源大语言模型StableLM，又爆火了！

点击下方卡片关注 CVer 公众号 AI CV重磅干货第一时间送达点击进入 gt 计算机视觉微信技术交流群金磊发自凹非寺转载自量子位 QbitAI 万万没想到以文生图著名的Stable Diffusion 也入局了大语言模
Java String 字符串截取保留小数点后两位

截取保留小数点后两位 public static String dealRateStr String rateStr int i rateStr indexOf 如果没有小数点不 if i 1 return rateStr 00 获取小数点
Java设计模式：23种设计模式全面解析，墙都不扶就服你

命令模式将命令请求封装为一个对象使得可以用不同的请求来进行参数化迭代器模式一种遍历访问聚合对象中各个元素的方法不暴露该对象的内部结构观察者模式对象间的一对多的依赖关系仲裁者模式用一个中介对象来封装一系列的对象交互备忘录模
关于定时任务简单小脚本

1 每4小时备份一次 etc 目录至 backup目录中保存的文件名称格式为 etc yyyy mm dd HH tar xz crontab e 进入编辑模式 tar JcPf创建文档并保存为 xz格式 0 4 tar JcPf bac
深入理解数据结构——图

include
SAC(Soft Actor Critic)学习记录

SAC Soft Actor Critic 学习记录基本介绍 SAC Soft Actor Critic 算法在近年来受到了许多的关注得到了不少深度强化学习研究者的好评这篇文章主要包含的内容有SAC算法的理论分析和核心代码实现与许多
ProGan,关键创新在于渐进式训练

2018年 NVIDIA首次用ProGAN解决了这一挑战研究人员一直无法生成高质量的大图像例如1024 1024 ProGAN的关键创新在于渐进式训练它首先用极低分辨率的图像如4 4 训练生成器和鉴别器然后每次增加一个更高分辨率的
Float比较大小

目录起因结论科学计数法十进制转二进制整数基本二进制科学计数法总结小数基本二进制科学计数法总结 IEEE754标准存储基本起因在阅读阿里巴巴开发手册时发现了一句话强制浮点数之间的等值判断基本数据类型不能
Linux（查看服务cpu核数和内存）

linux服务器中最重要的两个配置是CPU和内存那么怎么开始查看CPU核数和内存以及使用情况是日常运维中使用最多的操作查看linux服务器cpu最简单的命令是 cat proc cpuinfo 查看linux服务器cpu最简单的命令
TCP常见面试题

1 画出TCP的报头 2 说一下TCP的三次握手过程 3 为什么TCP握手需要三次 TCP是可靠的传输控制协议三次握手能保证数据可靠传输又能提高传输效率如果TCP的握手是两次 lt 1 gt 如果client发给server的SYN报文
Spring 事务事件控制解决业务异步操作解耦 TransactionSynchronizationManager Transaction

场景在业务中经常需要在执行数据库操作后事务提交完成发送消息或事件来异步调用其他组件执行相应的业务操作比如用户注册成功后发送激活码或激活邮件如果用户保存后就执行异步操作发送激活码或激活邮件但是前面用户保存后发生异常数据库进
kmeans聚类簇个数选择

借助sklearn库实现kmeans聚类和轮廓系数计算 from sklearn cluster import KMeans from sklearn metrics import silhouette score K range 2 20
使用Python与Stm32进行通信

方法利用python的serial函数库与STM32进行通信将Stm32用USB连接到电脑打开设备管理器查看端口端口为COM3 写下Python程序 import serial 连接串口 serial serial Serial C
python Typing模块-类型注解

写在篇前 typing 是python3 5中开始新增的专用于类型注解 type hints 的模块为python程序提供静态类型检查如下面的greeting函数规定了参数name的类型是str 返回值的类型也是str def gree
STL几种常见类型的比较

这里主要是想要比较几种容器的性能至于他们的接口不在考虑范围 Vector 相当于一个数组在内存中分配一块连续的内存空间进行存储支持不指定vector大小的存储 STL内部实现时首先分配一个非常大的内存空间预备进行存储即capaci
Mac pycharm 导入pyspark

转载于点击打开链接 1 前提已经安装了pycharm 下载了spark 官网下载我下的是spark 2 1 1 bin hadoop2 7 tgz 解压缩后为文件夹spark 2 1 1 bin hadoop2 7 我将文件放在了 A
C#项目实战｜人脸识别考勤

人脸识别考勤是一种基于人脸识别技术的智能化考勤系统可以实现快速准确的考勤记录提高考勤管理的效率和准确性本文将介绍如何使用C 语言开发人脸识别考勤系统一项目概述本项目使用C 语言采用人脸识别技术和数据库技术实现了一个基于人脸识
robots.txt 泄漏敏感信息

robots txt 泄漏敏感信息漏洞描述搜索引擎可以通过robots文件可以获知哪些页面可以爬取哪些页面不可以爬取 Robots协议是网站国际互联网界通行的道德规范其目的是保护网站数据和敏感信息确保用户个人信息和隐私不被侵犯

热门标签