mechanize 出现“内存不足”错误

2023-11-30

我试图从网站上一页一页地抓取一些信息，基本上这就是我所做的：

import mechanize
MechBrowser = mechanize.Browser()

Counter = 0

while Counter < 5000:
    Response = MechBrowser.open("http://example.com/page" + str(Counter))
    Html = Response.read()
    Response.close()

    OutputFile = open("Output.txt", "a")
    OutputFile.write(Html)
    OutputFile.close()

    Counter = Counter + 1

好吧，上面的代码最终抛出了“内存不足”错误，并且在任务管理器中显示该脚本在运行几个小时后耗尽了几乎 1GB 内存......这是怎么回事？！

有人能告诉我出了什么问题吗？

这并不完全是内存泄漏，而是一个未记录的功能。基本上，mechanize.Browser()将所有浏览器历史记录一起存储在内存中。

如果您添加一个呼叫MechBrowser.clear_history() after Response.close()，它应该可以解决问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

memory

urllib2

mechanize

mechanize 出现“内存不足”错误的相关文章

错误：process_executor.py:702: ... 当一些作业被分配给执行器时，工作人员停止了。这可能是由于工作超时太短造成的

根据主题中的错误修复方法是什么环境 Python 3 9 或 3 10 Windows 10 x64 使用时出现错误joblib https joblib readthedocs io en latest 对于并行处理 result c
使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
在python中将数据库表写入文件的最快方法

我正在尝试从数据库中提取大量数据并将其写入 csv 文件我正在尝试找出最快的方法来做到这一点我发现在 fetchall 的结果上运行 writerows 比下面的代码慢 40 with open filename a as f writ
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
Python Anaconda：如何测试更新的库是否与我现有的代码兼容？

我在 Windows 7 机器上使用 Python 2 7 Anaconda 安装进行数据分析和科学计算当新的库发布时例如新版本的 pandas patsy 等您建议我如何测试新版本与现有代码的兼容性是否可以在同一台机器上安装两个
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
python中basestring和types.StringType之间的区别？

有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
检测是否从psycopg2游标获取？

假设我执行以下命令 insert into hello username values me 我跑起来就像 cursor fetchall 我收到以下错误 psycopg2 ProgrammingError no results to fe
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

画布渐变表现

我目前正在使用画布编写一个小游戏对于游戏我需要某种雾来隐藏地图的大部分并且只有玩家周围的一小部分区域应该可见为此我使用第二个画布覆盖游戏发生的画布并用渐变填充它从透明到黑色 function drawFog fogc clea
连接到 firestore 模拟器时 Python firebase_admin 挂起

我无法从 python 连接到 firestore 模拟器连接并写入文档到真实项目工作正常但是在设置环境时设置函数永远不会解析变量 FIRESTORE EMULATOR HOST 代码 os environ FIRESTORE EMU
如何在 Python OpenCV 中保存视频

我已经使用 CV2 打开了一个视频使用进行了一些更改cv2 rectangle 现在当我这样做时cv2 imshow frame frame 它会播放视频相反我想以原始大小和帧速率将视频保存在某处您可以逐帧保存视频基于文档上的示
返回在 javascript 对象中找不到的键的默认值

当调用不在对象中的键时将返回 undefined 我想返回一个我指定的字符串而不是未定义的字符串例如 let obj key1 key1 let res obj key2 console log res I want console l
如何在 Angularjs 中创建过滤器？

我有这个课程集合 id 1 courseId 2 text John id 2 courseId 2 text Willi id 3 courseId 2 text Inga id 4 courseId 1 text Jerry id 5
如何用 VI/VIM 编辑器中每次出现的不同单词替换查找单词？

例如我有一个文本 10 3 4 2 10 4 10 不我想用不同的单词更改每 10 个我知道 s 10 replace words gc 但它只让我像 yes no 一样进行交互式替换但我想用不同的单词来更改 10 的每次出现例如
具有背景颜色的粗体文本样式的 Excel 行的 Java 代码

我用谷歌搜索了一些代码并找到了一些答案但无法以粗体形式获取 Excel 文件输出并设置背景颜色我尝试过以下代码你能告诉我哪里错了吗请看一下谢谢仅供参考我将用蓝色或任何浅色以粗体显示第一行背景如果你知道请帮忙看一下代码 Ex
为什么在子类化 tf.keras 层（或模型）类时实现“call”方法使层（模型）对象可调用？

当编写自定义的 tf keras 层时我们必须实现 call 方法因为只有如果对象具有有效的则可以像使用的函数一样调用类的对象 call 方法虽然我没有找到类似的东西 class tf keras model def call
Chrome 忽略从 WebAPI 控制器发送的 HttpResponse 的 Content-Disposition 标头中建议的扩展名

我正在尝试编写一个 WebAPI 控制器它可以动态生成 W indows 快捷方式文件 lnk 并将其发送回客户端但即使我在 Content Disposition 标头中指定 lnk 作为扩展名构建响应时 Chrome 仍会在另存为
Spring Boot yaml 文件中数字类型的 @Value

I got a data yml在以下结构的资源文件夹中 main header info 3600L 我使用Spring Boot版本2 4 2 我想注入属性main header1 info对于一个字段我按以下方式执行此操作 Comp
如何查找包含的存储过程？

我需要在 SQL Server 2008 中搜索存储过程其中可能包含数据库字段的名称或变量名称 SELECT ROUTINE NAME ROUTINE DEFINITION FROM INFORMATION SCHEMA ROUTINE
IE浏览器中的JQuery选择框焦点问题

下面的 input 与标签匹配该代码在所有浏览器中都可以正常工作除了在 Internet Explorer 中我需要单击选择框两次才能获得下拉列表 input focus function var rc this parents rc
如何将密钥信息保留在 Git 存储库之外

我的存储库中有一些文件其中一个包含 Adafruit 秘密密钥我想使用 Git 来存储我的存储库但我不想发布密钥保守秘密的最佳方法是什么而不必每次提交和推动某件事时都将其清空根据您想要实现的目标您可以选择以下方法之一将文件保
使用 d3.js 在强制布局中添加和删除节点时出现问题

我试图通过从 Zabbix API 获取数据来可视化服务器可用性以及随后的其他事情一旦可行您可以在 Zabbix API 文档中的此处 1 中查看有关返回数据的示例获取数据不是问题但我认为 d3 js 的数据连接遇到了一些问题
为什么 SQL 查询的结果没有按照我期望的顺序返回？

如果将项目插入表中然后我编写一个查询例如select from table 为什么结果与我期望的顺序不一样可以通过在语句中使用 Order by 子句来强制查询的顺序 SQL 数据库实际上并不了解您放置内容的顺序或者按照给定顺序存储
用于检查 API 与 Android 的兼容性的 Maven 插件

我正在寻找一个 Maven 插件可以检查 Jar Class 文件是否符合 Android 指定的 API 级别例如所有类和方法都可以在 Android API 中解析吗有人知道这样的插件吗 DX 工具似乎没有提供这样的功能或者我
mysqldb ..“NoneType”对象不可下标

这段代码在以下情况下工作正常cur execute and db commit 行被注释掉即如果我所做的只是打印查询则该程序将运行 n 行问题似乎出现在这里 player categories statistics cur fetc
将电子邮件地址设置为 ASP.NET 会员提供商中的用户名

我想在会员 api 中使用电子邮件地址作为用户名而不是接受用户名我希望用户可以使用电子邮件地址注册我的网站并且可以使用电子邮件 ID 和密码而不是用户名和密码登录这就是我们所做的因此它是可重用的我们可以在 web config
内插 NA 值

我有两组与时间无关的样本我想合并它们并计算缺失值在我不具备两者价值观的时代简化示例 A lt cbind time c 10 20 30 40 50 60 70 80 90 100 Avalue c 1 2 3 2 1 2 3 2 1
mechanize 出现“内存不足”错误

我试图从网站上一页一页地抓取一些信息基本上这就是我所做的 import mechanize MechBrowser mechanize Browser Counter 0 while Counter lt 5000 Response Me

mechanize 出现“内存不足”错误

mechanize 出现“内存不足”错误 的相关文章

随机推荐

热门标签

mechanize 出现“内存不足”错误的相关文章