urllib2 返回浏览器不同的页面？

2024-03-18

我正在尝试抓取一个页面（我的路由器的管理页面），但该设备似乎为 urllib2 提供与我的浏览器不同的页面。以前有人发现过这个吗？我怎样才能绕过它？

这是我正在使用的代码：

>>> from BeautifulSoup import BeautifulSoup
>>> import urllib2
>>> page = urllib2.urlopen("http://192.168.1.254/index.cgi?active_page=9133&active_page_str=page_bt_home&req_mode=0&mimic_button_field=btn_tab_goto:+9133..&request_id=36590071&button_value=9133")
>>> soup = BeautifulSoup(page)
>>> soup.prettify()

（html输出被markdown删除）

With firebug观察发送到服务器的标头和 cookie。然后与urllib2.请求 and cookie库模拟相同的请求。

编辑：你也可以使用机械化 http://wwwsearch.sourceforge.net/mechanize.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

screenscraping

urllib2

urllib2 返回浏览器不同的页面？的相关文章

MANIFEST.in、package_data 和 data_files 澄清吗？

我正在尝试创建一个 Python 包并且目录结构如下 mypkg init py module1 x py y py z txt module2 a py b py 然后我将所有文件添加到MANIFEST in当我检查创建的存档时它包含
pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
使用应用程序脚本将 MS Word 文件（保存在云端硬盘中）转换为 Google 文档

我被某些事情困住了找不到解决办法有没有办法使用文件 url 或 id 将存储在 Google Drive 中的 MS Word 文件转换为 Google 文档我目前有一个电子表格其中包含文件的网址或者也可以使用 python 脚
Python GTK + webkit - 在 gtk.main() 之后插入 JavaScript

我在终端中尝试了这个一切正常但是如果我在脚本内运行这个我无法在 gtk main 之后插入 JavaScript import gtk import webkit w gtk Window b webkit WebView w add
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
无法使用 BeautifulSoup 和 Requests 抓取下拉菜单

我想抓取百年灵网站上的产品页面以获取各种信息示例页面 https www breitling com gb en watches navitimer b01 chronograph 46 AB0127211C1A1 https www b
Tipfy：如何在模板中显示blob？

鉴于在 gae 上使用tipfy http www tipfy org python 以下模型 greeting avatar db Blob avatar 显示 blob 此处为图像的模板标签是什么在这种情况下斑点是一个图像这很棒
numpy：大量线段/点的快速规则间隔平均值

我沿着一维线有许多约 100 万个不规则间隔的点 P 这些标记线段这样如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等我还有每个段的 y
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
Pandas groupby apply 执行缓慢

我正在开发一个涉及大量数据的程序我正在使用 python pandas 模块来查找数据中的错误这通常工作得非常快然而我当前编写的这段代码似乎比应有的速度慢得多我正在寻找一种方法来加快速度为了让你们正确测试它我上传了一段相当大的
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
在seaborn中对箱线图x轴进行排序

我的数据框round data看起来像这样 error username task path 0 0 02 n49vq14uhvy93i5uw33tf7s1ei07vngozrzlsr6q6cnh8w 39 png 1 0 10 n49vq
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
沿轴 0 重复 scipy csr 稀疏矩阵

我想重复 scipy csr 稀疏矩阵的行但是当我尝试调用 numpy 的重复方法时它只是将稀疏矩阵视为对象并且只会将其作为 ndarray 中的对象重复我浏览了文档但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行我
Pip 无法在 Windows 上安装 Twisted

我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
如何从 nltk 下载器中删除数据/模型？

我在 python3 NLTK 中安装了一些 NLTK 包通过nltk download 尝试过它们但不需要它们现在想删除它们我怎样才能删除例如包large grammars来自我的 NLTK 安装我不想删除完整的 NLTK 安装
Java/Python 中的快速 IPC/Socket 通信

我的应用程序中需要两个进程 Java 和 Python 进行通信我注意到套接字通信占用了 93 的运行时间为什么通讯这么慢我应该寻找套接字通信的替代方案还是可以使其更快更新我发现了一个简单的修复方法由于某些未知原因缓冲输出流似
在python中对列表列表执行行总和和列总和

我想用python计算矩阵的行和和列和但是由于信息安全要求我无法使用任何外部库因此为了创建矩阵我使用了列表列表如下所示 matrix 0 for x in range 5 for y in range 5 for pos in

随机推荐

从 JSON 中插入 HTML 选择标签选项

所以事情是这样的我有一个 JSON 对象保存在我的 web 应用程序的 localStorage 中此 JSON 被保存为字符串其中JSON stringify 在我的函数之一内在页面加载上 localStorage setIte
socket.io的emit函数中允许使用数组吗？

是否可以发送对象数组socket io发出函数例如 io emit message data 123 data 456 Yes it is 您可以发送几乎任何类型并且可以将任何类型嵌套在另一种类型中 Strings Numbers 12
为什么匿名类型实例不能接受实体框架查询返回的空值？

当我尝试运行以下实体框架查询时 var l from s in db Samples let action db Actions Where x gt s SampleID x SampleID x ActionTypeID 1 First
如何存储/计算单个簇大小并在 NetLogo 中绘制它们

我有一个生成黄色斑块簇的模型我有兴趣查看簇大小的频率分布为此我从 NetLogo 代码库中的补丁集群示例中选择了代码它似乎在查找簇方面起作用参见下面的照片尽管我希望它不计算簇中的绿色斑块但我不知道如何获取大小或斑块计数
关于 printf 语句的混淆

所以我正在运行这段代码 include
Android：使用 Gradle 构建，使用 Maven 签名

我的 Android 构建在持续集成中运行良好但 androidSigning 除外 Gradle 可以允许开发人员清晰地捕获密钥库路径和密码这并不令人满意 1 你有解决方法吗比如密码加密 2 我现在的想法是使用 Gradle 进行构
自动递增第二列[重复]

这个问题在这里已经有答案了我有一个有 2 列的表 ID 列自动递增我正在尝试自动增加与 ID 相同的用户列id列但带有 user 前缀例如 user100 其中 ID 也是 100 基本上就像 stackoverflow 上所做的那
具有拉伸对齐功能的 Flexbox 容器中垂直居中的 div

我需要将一个 div 放在 Flex 容器中并保持该 div 的整个容器的高度显然我有align items stretch用于保持高度或align items center用于定心块 Flexbox 模型将 div 居中并保持父容器
在 React 中切换类

我正在将 React 用于一个有菜单按钮的项目 a href i i a 还有一个 Sidenav 组件例如
2 个纬度/经度点（坐标）列表之间的地理/地理空间距离

我有 2 个列表 list1 list2 以及各个地点的纬度经度一份清单 list2 的地点名称list1不具有我也想要 list1 中每个点的近似位置所以我想指出一点list1 尝试寻找最近的点list2并采取该地点我对其中的每
将 .class 转换为 .java

我有一些 class 文件需要转换为 java 所以我这样做了 javap c ClassName class 我一直有同样的错误 ERROR Could not find ClassName class 你们知道可能是什么原因吗我做了
GPUImage iOS 中未显示文本叠加

我正在尝试在视频上叠加一些文本但到目前为止还没有取得任何成功 videoCamera GPUImageStillCamera alloc initWithSessionPreset AVCaptureSessionPreset640x48
如何解决一般错误：2006 MySQL 服务器已消失

我正在执行一项操作将数百条记录插入 MySQL 数据库插入 176 条记录后我收到此错误 PDOException SQLSTATE HY000 一般错误 2006 MySQL 服务器已消失我有什么办法可以解决这个问题吗该过程是使
如何在Java中对ArrayList进行排序[重复]

这个问题在这里已经有答案了我有一个名为水果的课程我正在创建此类的列表并将每种水果添加到列表中我想根据水果名称的顺序对这个列表进行排序 public class Fruit private String fruitName pri
在模型中的belongs_to中使用委托时出现“未初始化常量”错误

我正在使用三个表的模型实现一个视图其中一个是连接表以下是表格 Recipe class Recipe lt ActiveRecord Base validates name presence gt true validates dire
如何正确重复使用卷曲手柄

我想正确地重用卷曲句柄这样它就不会给我错误并正常运行假设我有这段代码 CURL curl curl global init CURL GLOBAL ALL curl curl easy init curl easy setopt cur
标准环境下的 GCP：MySQL 数据库连接被拒绝

我的目标是让一个可用的 Python 2 7 项目 MySQL MS Word 文件在 GCP 上工作我意识到我需要 App Engine 应用程序将在其中运行缩放等 Cloud SQL working as MySQL db For
如何在使用继承时获取目标 C 中调用者的类名称？

我有一个名为 BaseClass 的基类许多类派生自基类即子类 1 子类 2 和子类 3 interface BaseClass NSObject void configure end implementation void confi
ValueType 堆栈空间耗尽

我的理解是 Net中的每个新线程都会分配1MB 堆栈空间 https stackoverflow com questions 4088448 the net stack vs windows stack 进一步我的理解是值类型存储在堆栈上
urllib2 返回浏览器不同的页面？

我正在尝试抓取一个页面我的路由器的管理页面但该设备似乎为 urllib2 提供与我的浏览器不同的页面以前有人发现过这个吗我怎样才能绕过它这是我正在使用的代码 gt gt gt from BeautifulSoup import B

urllib2 返回浏览器不同的页面？

urllib2 返回浏览器不同的页面？ 的相关文章

随机推荐

热门标签

urllib2 返回浏览器不同的页面？的相关文章